我正在尝试构建一个python脚本,用BeautifulSoup在网页中查找单词/术语。我希望它能让用户输入术语的连字符或非连字符版本,然后它会同时检查这两个版本,例如,“数据驱动”也会检查“数据驱动”。
如果我有这样的文本:
Slaying the ‘old school’ bosses with data-driven platforms.
Slaying the ‘old school’ bosses with data driven platforms.和正则表达式:
(.+(\W(data((-)|(\s))driven)\W).+)然后,它只捕获连字符版本,而不捕获非连字符版本。
我如何修改它才能正常工作?我在http://regexr.com/上看过
发布于 2017-07-03 23:56:07
您的模式同时捕获了连字符和非连字符,那么问题出在哪里?我不知道你的模式的原因,但对我来说它看起来很复杂。这个简单的怎么样?
data[- ]drivenhttps://stackoverflow.com/questions/44889741
复制相似问题