在这样的文档文件中,我有一个文章列表:
2世界银行集团,“目录来源:世界发展指标,数据来源:粮食及农业组织,AQUASTAT数据”。2014年10月15日,在线。可用:https://data.worldbank.org/indicator。3伊朗能源部,“在Zarrineh rood和Simineh rood盆地减少40%农业用水量的执行战略”,Miyandoab平原水资源和消费规划和管理研究,第1卷,2016年。
只需打印“”之间的每一篇文章的名称。
是我的代码可以访问段落:
from docx import Document
doc = Document("References.docx")
for para in doc.paragraphs:
para = str(i.text.encode("utf-8"))
print(i)发布于 2021-09-04 09:23:33
以下代码将提取每个段落引号中的所有字符串作为列表:
import re
for para in doc.paragraphs:
para = str(i.text.encode("utf-8"))
str_text = re.findall(r'“(.*?)”',para)您可以使用str_text (这是一个列表)来获取所需的文章。
https://stackoverflow.com/questions/69053695
复制相似问题