正则表达式在StringSearcher

Question

你好,

我试图在一个字符串中单独找到字母D，例如:B,G,D,DM,TD,DM,TD,D。在这个例子中，它是2d(我用红色标记的第三个D和最后一个D)。

不幸的是，我尝试过的所有正则表达式都得到了TD (e)中的D。使用D、g | D $)。

谢谢。

托尼

Answer 1 · 2020-03-15T04:18:22Z

最佳答案

回答通过隆 ·3月15日凌晨4点18分

嗨@aviveiro，元字符'\b'代表一个词的边界(包括空格、正文的开始/结束、逗号、句号等)可能会对你有帮助。例如，这个正则表达式匹配单词边界中间的单个字符'D'。

(? < = \ b) D (? = \ b)

添加评论·显示2·分享

| 4000角色需要字符左字符超过

附件:最多可使用10个附件(包括图像)，每个附件的最大大小为4.0 MB，总大小为4.0 MB。

arnold_bijlsma ·三月十七日上午十时零七分 0

@takashi:优秀的答案。我仍然不完全熟悉\b的功能。

注意:在“普通”正则表达式中，确实需要前向和后向断言。但是在StringSearcher中，您不需要它们，因为它将捕获所有实例，而\b根据定义什么也不捕获，所以您只需要使用它们

bD \ b \

并在Advanced部分中指定第一个列表。

findallsingleds.png (14.4 kB)

隆 ·3月17日上午11:14 1

@arnold_bijlsma你说得对。在这里，向后和向前并不是必需的。谢谢你指出来。

Answer 2 · 2020-03-17T16:55:49Z

回答通过arnold_bijlsma ·3月17日下午4点55分

关键的一点是，对于StringSearcher中的RegEx实现，您不需要使用前向/后向断言，也不需要使用任何分组括号来捕获测试字符串中单个字母D的两个实例。
但是您说得对，FME之外的其他实现可以给出不同的输出。

添加评论·分享

| 4000角色需要字符左字符超过

附件:最多可使用10个附件(包括图像)，每个附件的最大大小为4.0 MB，总大小为4.0 MB。

Answer 3 · 2020-03-17T15:26:04Z

word boundary \b表示所有非单词字符，所以\bD\b匹配字符串，因为它匹配某些部分。

下面的说法至少是不正确的:

在“普通”正则表达式中，确实需要前向和后向断言

要捕获一个位置，需要用大括号括起来:\b(D)\b

(当然，有一个非捕获版本(?:)将封顶，但不报告。

与流行的说法相反，\b是一个(零长度)断言。如果你用括号把它括起来，它会被抓取。开始也是一样，结束也是一样。

如果grepped, regexp结果总是显示enire字符串。所有匹配的列表名。

要获取indvidual捕获的D，需要将它括在大括号中，并使用子表达式匹配列表名。

此外，使用lookbehind的味道并不多。Python的版本可以，我想这会让你们高兴。

有一个网站展示了所有的口味和他们的影响。

可以通过前向和一些更多的regexp调整来模拟Lookbehind。

当然，从我上次读到它以来，它可能已经改变了。

读读这个问题:Jan Goyvaerts的作品非常适合这个。正则表达式(见朋友。他的文件在那里)但是有很多好文件。

Answer 4 · 2020-03-15T11:53:50Z

回答通过bwn ·3月15日上午11:53

@aviveiro不要忘记，在处理以值分隔的字符串这样的简单情况下，还有其他方法AttributeSplitter。

添加评论·分享

| 4000角色需要字符左字符超过

附件:最多可使用10个附件(包括图像)，每个附件的最大大小为4.0 MB，总大小为4.0 MB。