首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >正则表达式:忽略重复单词,除了最后的重复单词?

正则表达式:忽略重复单词,除了最后的重复单词?
EN

Stack Overflow用户
提问于 2012-12-27 17:23:23
回答 1查看 179关注 0票数 0

我希望有人能帮我这个忙。

我有以下案文:

XX Oferta de empleo como Gestorómico teste y financiero en Importante empresa,Jerez de la Frontera XX

我只想和Importante empresa匹配。

以下正则表达式将运行良好:

代码语言:javascript
复制
XX.* en ([^,]+), .*XX

但是,如果文本有两次en,例如:

XX Oferta de empleo como laómico en teste y financiero en Importante empresa

它将与以下内容相匹配:

代码语言:javascript
复制
teste y financiero en Importante empresa

你们中有谁知道如何使我的正则表达式在匹配时只使用与逗号最近的en,所以不管前面有多少en,我只匹配Importante empresa

谢谢。

EN

回答 1

Stack Overflow用户

发布于 2012-12-27 17:51:45

对于您的示例,它应该是有效的,因为在正则表达式开始时贪婪的.*将匹配所有ens,然后只回溯到字符串中的最后一个en,以允许正则表达式的其余部分匹配。我只能想到一种情况,即在PHP中使用/U修饰符使贪婪的量词变懒,反之亦然。

但是,您可以以任何方式明确您的需求:

代码语言:javascript
复制
XX.* en ((?:(?!\ben\b)[^,])+), .*XX

现在,负展望(?!\ben\b)断言,在en,之间不可能有进一步的en (使用\b单词边界来避免错误的阳性匹配,比如在encuentrodicen中)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/14058614

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档