首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python lookbehind断言中的撇号

Python lookbehind断言中的撇号
EN

Stack Overflow用户
提问于 2013-05-03 19:03:13
回答 1查看 180关注 0票数 2

我尝试使用Python正则表达式来获取字符分隔字符串的第一个标记。我不想把带反斜杠的分隔符当作真正的分隔符,所以我使用了一个负向回溯断言。当分隔符是逗号时,它可以正常工作。

代码语言:javascript
复制
>>> import re
>>> re.match("(.*?)(?<!\\\\),.*", "Hello\, world!,This is a comma separated string,Third value").groups(1)[0]
'Hello\\, world!'

然而,通过用撇号替换逗号的完全相同的代码根本不起作用。

代码语言:javascript
复制
>>> import re
>>> re.match("(.*?)(?<!\\\\)'.*", "Hello\' world!'This is an apostrophe separated string'Third value").groups(1)[0]
'Hello'
>>>

我使用的是python 2.7.2,但我使用的是Python 3(在Ideone上测试的)。Python re documentation并没有表明'是一个特殊字符,所以我真的想知道,为什么我的'会被区别对待?

(请不要评论:谁会想要一个撇号分隔的文件。好吧..。我有……)

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-05-03 19:18:21

代码语言:javascript
复制
print(repr("\'"),repr("\,"))

结果如下:

代码语言:javascript
复制
"'" '\\,'

正如您所看到的,"\'"实际上并没有包含\\。因此,当您将其更改为"\\'"时,模式将匹配producing:

代码语言:javascript
复制
Hello\' world!

"\'"实际上是一个escape sequence

\‘单引号(')

很明显,原因是

代码语言:javascript
复制
>>> ord("\'") == ord("'")
True

是因为"\'" 上等同于"'"\'是一个转义序列是有道理的:

代码语言:javascript
复制
>>> 'i\'ll'
"i'll"
票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/16357429

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档