首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用一个正则表达式进行多个替换

用一个正则表达式进行多个替换
EN

Stack Overflow用户
提问于 2015-12-10 09:37:43
回答 1查看 2.4K关注 0票数 2

让我们假设,为了简单起见,我们有以下字符串:

“约翰爱玛丽,玛丽爱杰克,杰克不关心约翰和玛丽。”

让我们假设我想用regex来改变故事的角色。

约翰->约瑟夫

玛丽->杰西卡

杰克->基思

当然我可以改变其中的一个,一次一个。

但是我想知道是否有可能用一个正则表达式替换来改变它们,比如“多重替换”或者“有条件替换”。

类似于:

regex:(?:(?<name1>John)|(?<name2>Mary)|(?<name3>Jake))

替换:(?(name1)Joseph|(?(name2)Jessica|(?(name3)Keith)))

这只是一个简单的例子。

在我的应用程序中,我必须对每个字符串执行大约20个替换,这会影响应用程序的性能。

我使用的regex口味是PCRE。

应用程序是使用Qt框架使用C++编写的。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-12-13 20:21:09

所以你用的是所谓的PCRE口味。很好,但这并没有说明你使用的是哪个库。让我们在这里回顾几个选项,因为有几个不同的库声称与Perl兼容。

助推

这是最简单的解决办法。boost::regex完全支持您通过其Boost扩展格式字符串语法所要求的内容。

因此,您可以替换该模式:

代码语言:javascript
复制
(?<name1>John)|(?<name2>Mary)|(?<name3>Jake)

使用替换字符串:

代码语言:javascript
复制
(?{name1}Joseph:(?{name2}Jessica:Keith))

当然了,很管用。您可以在Notepad++中测试它,但是下面是一些示例代码:

代码语言:javascript
复制
#include <string>
#include <iostream>
#include <boost/regex.hpp>

int main(int argc, char **argv) {
    std::string subject("John loves Mary, Mary loves Jake and Jake doesn't care about John and Mary.");
    const char* replacement = "(?{name1}Joseph:(?{name2}Jessica:Keith))";

    boost::regex re("(?<name1>John)|(?<name2>Mary)|(?<name3>Jake)", boost::match_perl);

    std::string result = boost::regex_replace(subject, re, replacement, boost::format_all);
    std::cout << result << std::endl;

    return 0;
}

PCRE2

PCRE 缠住通过Boost引入了更丰富的替换语法,通过PCRE2_SUBSTITUTE_EXTENDED。在这篇文章(v10.20)中,这段代码还没有发布,但是它可以在源代码存储库(修订版381)中使用,所以如果您现在需要这个解决方案,就必须从源代码构建PCRE2。

模式相同,但替换字符串具有不同的语法:

代码语言:javascript
复制
${name1:+Joseph:${name2:+Jessica:Keith}}

下面是一些示例C代码:

代码语言:javascript
复制
#include <stdio.h>
#include <string.h>

#define PCRE2_CODE_UNIT_WIDTH 8
#include <pcre2.h>

int main(int argc, char **argv) {
    int error;
    PCRE2_SIZE erroffset;

    const PCRE2_SPTR pattern = (PCRE2_SPTR)"(?<name1>John)|(?<name2>Mary)|(?<name3>Jake)";
    const PCRE2_SPTR subject = (PCRE2_SPTR)"John loves Mary, Mary loves Jake and Jake doesn't care about John and Mary.";
    const PCRE2_SPTR replacement = (PCRE2_SPTR)"${name1:+Joseph:${name2:+Jessica:Keith}}";

    pcre2_code *re = pcre2_compile(pattern, PCRE2_ZERO_TERMINATED, 0, &error, &erroffset, 0);
    if (re == 0)
        return 1;

    pcre2_jit_compile(re, PCRE2_JIT_COMPLETE);

    PCRE2_UCHAR output[1024] = "";
    PCRE2_SIZE outlen = sizeof(output) / sizeof(PCRE2_UCHAR);

    int rc = pcre2_substitute(re, subject, PCRE2_ZERO_TERMINATED, 0, PCRE2_SUBSTITUTE_GLOBAL | PCRE2_SUBSTITUTE_EXTENDED, 0, 0, replacement, PCRE2_ZERO_TERMINATED, output, &outlen);
    if (rc >= 0)
        printf("%s\n", output);

    pcre2_code_free(re);
    return 0;
}

PCRE

有了PCRE (

...which意味着,如果您使用的是库,那么无论如何您都可以完全控制替换过程。您可以使用如下模式:

代码语言:javascript
复制
John(*MARK:1)|Mary(*MARK:2)|Jake(*MARK:3)

然后,通过对最后遇到的MARK进行判别来代替。

Qt

Qt的QRegularExpression类封装了PCRE库(不是PCRE2),但它似乎没有公开所有的PCRE特性。

无论如何,接受过载QRegularExpression看起来并不是功能齐全的:

代码语言:javascript
复制
QString & QString::replace(const QRegularExpression & re, const QString & after)

所以你只能靠自己了。

我的2美分

嘿,也许对于这么简单的替换,正则表达式太过分了.如果您有性能问题,您应该尝试手工实现这些替换-精心编制的算法应该比regex解决方案更快。只需确定你的代码,看看罪魁祸首在哪里。

票数 7
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34198247

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档