首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用regex选择术语的连字符或非连字符版本

使用regex选择术语的连字符或非连字符版本
EN

Stack Overflow用户
提问于 2017-07-03 23:51:42
回答 1查看 38关注 0票数 2

我正在尝试构建一个python脚本,用BeautifulSoup在网页中查找单词/术语。我希望它能让用户输入术语的连字符或非连字符版本,然后它会同时检查这两个版本,例如,“数据驱动”也会检查“数据驱动”。

如果我有这样的文本:

代码语言:javascript
复制
Slaying the ‘old school’ bosses with data-driven platforms.

Slaying the ‘old school’ bosses with data driven platforms.

和正则表达式:

代码语言:javascript
复制
(.+(\W(data((-)|(\s))driven)\W).+)

然后,它只捕获连字符版本,而不捕获非连字符版本。

我如何修改它才能正常工作?我在http://regexr.com/上看过

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-07-03 23:56:07

您的模式同时捕获了连字符和非连字符,那么问题出在哪里?我不知道你的模式的原因,但对我来说它看起来很复杂。这个简单的怎么样?

代码语言:javascript
复制
data[- ]driven
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44889741

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档