首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >处理docs文件:在python中打印每个段落的特定部分

处理docs文件:在python中打印每个段落的特定部分
EN

Stack Overflow用户
提问于 2021-09-04 08:36:59
回答 1查看 80关注 0票数 0

在这样的文档文件中,我有一个文章列表:

2世界银行集团,“目录来源:世界发展指标,数据来源:粮食及农业组织,AQUASTAT数据”。2014年10月15日,在线。可用:https://data.worldbank.org/indicator。3伊朗能源部,“在Zarrineh rood和Simineh rood盆地减少40%农业用水量的执行战略”,Miyandoab平原水资源和消费规划和管理研究,第1卷,2016年。

只需打印“”之间的每一篇文章的名称。

是我的代码可以访问段落:

代码语言:javascript
复制
from docx import Document

doc = Document("References.docx")

for para in doc.paragraphs:
    para = str(i.text.encode("utf-8"))
    print(i)
EN

回答 1

Stack Overflow用户

发布于 2021-09-04 09:23:33

以下代码将提取每个段落引号中的所有字符串作为列表:

代码语言:javascript
复制
import re
for para in doc.paragraphs:
    para = str(i.text.encode("utf-8"))
    str_text = re.findall(r'“(.*?)”',para)

您可以使用str_text (这是一个列表)来获取所需的文章。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69053695

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档