首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何从已知模式中查找未知字符串?python re.findall

如何从已知模式中查找未知字符串?python re.findall
EN

Stack Overflow用户
提问于 2022-07-06 10:55:38
回答 1查看 51关注 0票数 0

我有一个包含字符串的html文本,例如句子转换器/释义-MiniLM-L6-v2。

我想提取所有出现在“语句转换/”之后的字符串。

我尝试了models = re.findall("sentence-transformers/"+"(\w+)", text),但是它只输出第一个单词(复述),而我想要完整的“释义-MiniLM-L6-v2”。

此外,我也不知道的连(释义-迷你L6 L6-v2)的先验。

如何提取完整的字符串?

非常感谢,Ele

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-07-06 11:04:15

正则表达式的问题是,-不是一个单词字符,您只是在搜索单词字符。下面的regex适用于您的示例:

代码语言:javascript
复制
text = 'sentence-transformers/paraphrase-MiniLM-L6-v2'
models = re.findall(r'sentence-transformers/([\w-]+)', text)

assert models[0] == 'paraphrase-MiniLM-L6-v2'
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72882334

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档