斯潘8
斯潘4
所以这是一个不断出现的问题…我们需要报告两个版本的报告之间的文本差异。我可以访问前后字段并将其读到FME中,但我正在寻找分析字符串和报告差异(添加和删除)的方法。
最终的目标是用清晰标记的添加(绿色)和删除(红色)来格式化报告。不过,作为开始,我必须找到一些方法来分析这两个字符串,并将其分解到足以重新组装正确格式的字符串。也许是HTML。没有什么比简单的答案更让人兴奋的了,所以我怀疑这并不容易。)
我查看了自定义工作区“fuzzystringcomparer”和“fuzzystringcomparefrom2dataset”,但我认为他们不会对我有多大帮助。我想到了一个将字符串分割成单个单词的过程,并使用正则表达式进行重复循环,以确定之前存在哪些块,并识别添加和删除,但它现在开始看起来更像一个论文项目,而不是很容易实现的。所以我想我应该在这里问一下,是否有人有其他的想法,可能会使我的大脑发生变化,并把它放在一条通往成功的潜在道路上!提前感谢您的洞察力。
附言:我知道一些在线文本差异。工具,甚至找到了一个非常好的PDF比较工具,它保留了原始格式(这实际上是可取的,但对于这个任务来说并不重要),但我正在寻找一种更直观地报告数据差异的方法,并对布局有一些控制。BeyondCompare也做得很好,但是它缺乏创建一个包含所有差异的单一差异报告的控制。
您好!@ dBaldACCHIO1,
我将检查这个python模块并在pythoncaller中使用它:https://docs.python.org/3.5/library/difflib.html这是一个用法例子.
希望这有帮助!
?2019安全亚搏在线软件公司|合法的