斯潘8
斯潘4
你好,我有个问题。所附表是一个包含10000条记录的Excel数据集的快照(使用虚拟名称等)。如果公司的员工每人都有一张进入办公楼的卡,这个数据集记录了他们每次进入大楼的详细信息,在门口刷卡,过去一周。
在理想的世界里,每个员工都应该有一个唯一的“员工编号”和一个唯一的“卡号”。因此在本例中,John Smith的“员工编号”应为100,“卡号”为1。然而,我们可以看到他也有两次进入大楼的“卡号”为2,不管什么原因。
也,我们可以为莎拉·布朗看到,她的“卡号”应该是5,但出于某种原因,她有两个“员工编号”(400和500),实际上她应该只有一个“员工编号”400。
最好的方法是什么?使用FME,我可以测试这样的数据集,使其“通过”(到工作台流程的下一个阶段)每个事件,其中一个员工对其每个记录都具有预期的“员工编号”和预期的“卡号”,但也要标记所有出现的事件,它们要么有不同的“员工编号”,要么有不同的“卡号”?
谢谢
谢谢Trentasafe。亚搏在线然而,假设我不知道每个员工的员工编号或卡号(假设有500名员工),那么我的问题更多的是如何运行一个测试,输出结果将导致每个员工只有一个员工编号和一个卡号(如预期的那样)?换句话说,员工编号应始终具有分配给它的同一卡号(如果不是这样的情况,则标记为“错误”)。
(对丹纳特塞弗-也亚搏在线谢谢你的回答,但不幸的是,我所拥有的FME版本不支持Matcher Transformer。)
如能为我的问题提供任何解决方案,我将不胜感激……
你好@克里夫·韦德,
我认为最好的开始是使用测试滤波器变压器,这将允许您对数据进行一些条件测试。例如,
如果firstname=john
和
卡号!= 1
输出端口:失败
其他:未过滤
这将从fail(可以命名为其他名称)端口中返回2个功能,其中名称john smith使用的员工卡不是1。这似乎不是100%的效率,但目前是我能想象的唯一方法。如果你知道每个员工的期望值,它应该是有效的。
希望有帮助。
?2019安全亚搏在线软件公司|合法的