文章/答案/技术大牛

发布

社区首页 >问答首页 >正则表达式:忽略重复单词，除了最后的重复单词？

问正则表达式:忽略重复单词，除了最后的重复单词？
EN

Stack Overflow用户

提问于 2012-12-27 17:23:23

回答 1查看 179关注 0票数 0

我希望有人能帮我这个忙。

我有以下案文：

XX Oferta de empleo como Gestorómico teste y financiero en Importante empresa，Jerez de la Frontera XX

我只想和Importante empresa匹配。

以下正则表达式将运行良好：

XX.* en ([^,]+), .*XX

但是，如果文本有两次en，例如：

XX Oferta de empleo como laómico en teste y financiero en Importante empresa

它将与以下内容相匹配：

teste y financiero en Importante empresa

你们中有谁知道如何使我的正则表达式在匹配时只使用与逗号最近的en，所以不管前面有多少en，我只匹配Importante empresa？

谢谢。

regex

回答 1

Stack Overflow用户

发布于 2012-12-27 17:51:45

对于您的示例，它应该是有效的，因为在正则表达式开始时贪婪的.*将匹配所有ens，然后只回溯到字符串中的最后一个en，以允许正则表达式的其余部分匹配。我只能想到一种情况，即在PHP中使用/U修饰符使贪婪的量词变懒，反之亦然。

但是，您可以以任何方式明确您的需求：

XX.* en ((?:(?!\ben\b)[^,])+), .*XX

现在，负展望(?!\ben\b)断言，在en和,之间不可能有进一步的en (使用\b单词边界来避免错误的阳性匹配，比如在encuentro或dicen中)。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/14058614

复制

相似问题

问正则表达式:忽略重复单词，除了最后的重复单词？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问正则表达式:忽略重复单词，除了最后的重复单词？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问正则表达式:忽略重复单词，除了最后的重复单词？
EN