我在试着从两个点之间提取一个句子。所有的句子中都有inflam或Inflam,这是我的具体词汇,但我不知道如何做到这一点。
我想要的是".The大部分的底层纤维结缔组织由慢性炎症细胞的弥漫性聚集物组成。“或".The纤维结缔组织显示分散的血管结构和可能的慢性炎症。“从一段长的
到目前为止,我尝试的是这个#@标题提取物显微炎症{表单宽度:"20%“}
def inflammation1(microscopic_description):
PATTERNS=[
"(?=\.)(.*)(?<=inflamm)",
"(?=inflamm)(.*)(?<=.)",]
对于模式中的模式:PATTERNS= re.findall( pattern,microscopic_description)如果len(PATTERNS)> 0:断开
inflammation1 =‘’.联接(k在匹配中表示k)
返回(inflammation1)
对于索引,microscopic_description在枚举(文本):print(inflammation1(microscopic_description))打印(“#”*79,索引)
这对我不起作用,给我带来了错误。当我分离我的模式并在不同的细胞中运行它们时,它们就工作了。问题是,他们并没有一起给我“”之间的句子。还有“。”发炎之前和发炎后。
发布于 2022-10-02 22:04:10
import re
string='' # replace with your paragraph
print(re.search(r"\.[\s\w]*\.",string).group()) #will print first matched string
print(re.findall(r"\.[\s\w]*\.",string)) #will print all matched strings发布于 2022-10-02 22:04:56
你可以试着在课文的每个句子中检查单词。
for sentence in text.split("."):
if word in sentence:
print(sentence[1:])在这里,你这样做,如果你找到这个词,你打印句子没有空格在它的开头。你可以用任何你想要的方式修改它。
https://stackoverflow.com/questions/73929503
复制相似问题