首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >REGEXP -如何阅读“字符?

REGEXP -如何阅读“字符?
EN

Stack Overflow用户
提问于 2014-02-17 20:31:54
回答 2查看 64关注 0票数 0

我正在使用hadoop pig和正则表达式(REGEX_EXTRACT_ALL) --这是Java解析。我有一个字符串:

代码语言:javascript
复制
"DYN_USER_ID=32753477; $Path=\"/\"; DYN_USER_CONFIRM=e6d2a0a7b7715cb10d1dca504e3c5e80; $Path=\"/\"" "Nokia6070/2.0 (03.20) Profile/MIDP-2.0 Configuration/CLDC-1.1"

我列出了两组:

代码语言:javascript
复制
First: DYN_USER_ID=32753477; $Path=\"/\"; DYN_USER_CONFIRM=e6d2a0a7b7715cb10d1dca504e3c5e80; $Path=\"/\"

Second: Nokia6070/2.0 (03.20) Profile/MIDP-2.0 Configuration/CLDC-1.1

正如您所看到的,在第一个字符串中有“字符,但带有转义字符。

简单的解决方案是:

代码语言:javascript
复制
"(.*)" "(.*)"

但这是最好的吗?

EN

回答 2

Stack Overflow用户

发布于 2014-02-17 20:55:32

代码语言:javascript
复制
"(.*)(?<!\\\\)" "(.*)"

这里使用:(?<!☀),其中☀是某个字符串,这里的字符退格由正则表达式转义的反斜杠和字符串转义的反斜杠表示。

票数 1
EN

Stack Overflow用户

发布于 2014-02-17 21:16:48

理想情况下,您应该使用被取反的字符类[^"],这样它就可以从第一个分隔符"到最后一个分隔符"进行匹配,但问题是它忽略了转义的"字符。如果字符串中可以有转义的"和转义的\,最好使用下面这样的代码:

代码语言:javascript
复制
"((?:\\.|[^"\\])+)" "((?:\\.|[^"\\])+)"

(?:\\.|[^"\\])+将匹配转义字符或多个[^"\\]字符。

regex101 demo

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21829210

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档