首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用regex查找并替换注释块中的(部分)字符串

用regex查找并替换注释块中的(部分)字符串
EN

Stack Overflow用户
提问于 2013-08-05 19:49:12
回答 5查看 1.2K关注 0票数 4

我正在试图找到一个可以在注释块中出现的字符串。这个字符串可以是一个单词,但也可以是一个单词的一部分。例如,假设我在寻找"codex“这个词,那么这个单词应该替换为"bindex”,但是即使它是一个单词的一部分,比如"codexing“。这应该改为"bindexing“。

诀窍是,只有当这个词在注释块中时才会发生这种情况。

代码语言:javascript
复制
/* Lorem ipsum dolor sit amet, codex consectetur adipiscing elit. */

This word --> codex should not be replaced

/* Lorem ipsum dolor sit 
 * amet, codex consectetur 
 * adipiscing elit. 
 */

/** Lorem ipsum dolor sit 
 * amet, codex consectetur 
 * adipiscing elit. 
 */

// Lorem ipsum dolor sit amet, codex consectetur adipiscing elit.

# Lorem ipsum dolor sit amet, codex consectetur adipiscing elit.

------------------- Below "codex" is part of a word -------------------

/* Lorem ipsum dolor sit amet, somecodex consectetur adipiscing elit. */

/* Lorem ipsum dolor sit 
 * amet, codexing consectetur 
 * adipiscing elit. 
 */

And here also, this word --> codex should not be replaced

/** Lorem ipsum dolor sit 
 * amet, testcodexing consectetur 
 * adipiscing elit. 
 */

// Lorem ipsum dolor sit amet, __codex consectetur adipiscing elit.

# Lorem ipsum dolor sit amet, codex__ consectetur adipiscing elit.

到目前为止,我掌握的是这样的代码:

代码语言:javascript
复制
$text = preg_replace ( '~(\/\/|#|\/\*).*?(codex).*?~', '$1 bindex', $text);

正如您可以看到的,在这个例子中,这并不是真正的工作方式,我想。它不会在多行/* */注释块中替换单词,有时它也会删除单词"codex“前面的所有文本。

如何改进正则表达式,使其满足我的要求?

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2013-08-05 20:01:44

由于您在这里处理多行文本,所以应该使用s修饰符(DOTALL)来匹配多行文本。另外,正斜杠也不需要转义。

试试下面的代码:

代码语言:javascript
复制
$text = preg_replace ( '~(//|#|/\*).*?(codex).*?~s', '$1 bindex', $text );
票数 3
EN

Stack Overflow用户

发布于 2013-08-05 20:22:35

代码语言:javascript
复制
$text = preg_replace ( '~(//|#|/\*)(.*?)(codex).*?~s', '$1$2bindex', $text );

这并不是删除“codex”之前的评论,就像anubhava的答复一样。

票数 2
EN

Stack Overflow用户

发布于 2013-08-05 21:40:07

编辑我编辑这个答案是因为尽管我当时天真无情,但我决定承认用一个简单或复杂的preg_replace解决这个问题是不可能的!对不起,那个好心的人把我的答案搞砸了。

要回答这个问题:改进您的模式是不可能的,使用preg_replace是不可能的!您必须为preg_replace_callback构建一个与整个注释匹配的模式,并继续替换回调函数中出现的codex

这个版本可以处理任何类型的注释,并且不会在这种字符串、/**/ codex /**//*xxxx codex codex xxxx*/或任何其他陷阱中失败。

代码语言:javascript
复制
$result = preg_replace_callback('~/\*.*?\*/|#\N+|//\N+~s', function($m) {
    return stri_replace('codex', 'bindex', $m[0]);
}, $subject);

请注意,除了此模式更简单这一事实外,它也是有效的,因为交替的每个分支都是“锚定”的,因为它们以一个文字字符开始。因此,这种模式从自动优化中获益。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18066505

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档