我有一个数据集,其中几个特点(即。行)可以是同一功能的不同版本。其中一个版本将是当前版本,其余的将是历史版本。我试图使用排序之前的复印机,以确保该功能的当前版本进入复印机,因此保留通过唯一的端口。以前的版本都应该转到复制端口,可以忽略
我还试图做排序,以便我可以选择“是”输入是有序的复印机,以提高性能。到目前为止,我不得不在一个属性中使用X替换空值,并对3个属性进行排序,以实现这一点,这可能会抵消任何来自输入在DuplicateFilter中的输入is Ordered =“Yes”的性能增益(之后我也必须重新为这些X值设置null !)我还没有对真实数据进行比较测试。
我提出了一个关于Sorter的想法…
https://knowledge.亚搏在线safe.com/idea/41576/sorter-options-for-handling-null-missing-empty-str.html