斯潘8
斯潘4
我有一个数据集,其中有几个特性(即行)可能是同一功能的不同版本。其中一个版本是当前版本,其余版本是历史版本。我尝试在复制过滤器之前使用排序器,以确保该功能的当前版本首先进入复制过滤器,因此通过唯一端口保留。以前的版本都应该转到复制端口,可以忽略。
我还尝试进行排序,这样我就可以选择“是”来输入,并在复印机中进行排序,以提高性能。到目前为止,我已经在一个属性中用x替换了空值,并对3个属性进行排序,以实现这一点,在DuplicateFilter中,输入的任何性能增益都可能为负,在DuplicateFilter中,ordered=“yes”(我随后也必须将这些x值重新空!).我还没有对真实数据进行比较测试。
我为分拣机提出了一个主意…
https://knowledge.亚搏在线safe.com/idea/41576/sorter-options-for-handling-null-missing-empty-str.html
?2019安全亚搏在线软件公司|合法的