首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >有没有一个python包可以读取微软office文件的底层xml?

有没有一个python包可以读取微软office文件的底层xml?
EN

Stack Overflow用户
提问于 2020-09-02 17:49:33
回答 1查看 159关注 0票数 1

我想用python读取PPTX文件的XML,然后将字符串/数据结构保存到一个变量中。

我还找不到让我用Python做这件事的包。

EN

回答 1

Stack Overflow用户

发布于 2020-09-02 18:04:36

如果我理解正确的话,您可以只使用内置的zipfile模块。

代码语言:javascript
复制
import zipfile
archive = zipfile.ZipFile('<My Powerpoint Name>.pptx', 'r')
xml_file = archive.open('[Content_Types].xml')
text = xml_file.read()
print(text)

这将直接在归档文件中打印出[Content_Types].xml中的xml文本。

如果想要解析XML,可以使用内置的xml模块。

代码语言:javascript
复制
import zipfile
import xml.etree.ElementTree as ET

archive = zipfile.ZipFile('<My Powerpoint Name>.pptx', 'r')
xml_file = archive.open('[Content_Types].xml')
text = xml_file.read()

root = ET.fromstring(text)
value_to_find = r'application/vnd.openxmlformats-package.relationships+xml'
for child in root:
    if child.attrib['ContentType'] == value_to_find:
        print(child.attrib)
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63702975

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档