文章/答案/技术大牛

发布

社区首页 >问答首页 >处理docs文件:在python中打印每个段落的特定部分

问处理docs文件:在python中打印每个段落的特定部分
EN

Stack Overflow用户

提问于 2021-09-04 08:36:59

回答 1查看 80关注 0票数 0

在这样的文档文件中，我有一个文章列表：

2世界银行集团，“目录来源:世界发展指标，数据来源:粮食及农业组织，AQUASTAT数据”。2014年10月15日，在线。可用：https://data.worldbank.org/indicator。3伊朗能源部，“在Zarrineh rood和Simineh rood盆地减少40%农业用水量的执行战略”，Miyandoab平原水资源和消费规划和管理研究，第1卷，2016年。

只需打印“”之间的每一篇文章的名称。

是我的代码可以访问段落：

from docx import Document

doc = Document("References.docx")

for para in doc.paragraphs:
    para = str(i.text.encode("utf-8"))
    print(i)

python

file

document

word

python-re

回答 1

Stack Overflow用户

发布于 2021-09-04 09:23:33

以下代码将提取每个段落引号中的所有字符串作为列表：

import re
for para in doc.paragraphs:
    para = str(i.text.encode("utf-8"))
    str_text = re.findall(r'“(.*?)”',para)

您可以使用str_text (这是一个列表)来获取所需的文章。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69053695

复制

相似问题

问处理docs文件:在python中打印每个段落的特定部分
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问处理docs文件:在python中打印每个段落的特定部分EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问处理docs文件:在python中打印每个段落的特定部分
EN