首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >python在linux上将microsoft office文档转换为纯文本

python在linux上将microsoft office文档转换为纯文本
EN

Stack Overflow用户
提问于 2009-03-26 12:24:44
回答 7查看 11.1K关注 0票数 11

关于在linux上使用python将.doc、.ppt和.xls转换为纯文本的方法,有什么建议吗?实际上,任何转换方法都是有用的。我已经考虑过使用Open Office,但我想要一个不需要安装Open Office的解决方案。

EN

回答 7

Stack Overflow用户

回答已采纳

发布于 2009-03-26 22:57:39

我使用命令行-solution(然后使用Python subprocess module从Python运行工具)。

msword (catdoc),excel (xls2csv)和ppt (catppt)的转换器可以在这里找到(源代码格式):http://vitus.wagner.pp.ru/software/catdoc/

不能真的评论catppt的用处,但catdoc和xls2csv工作得很好!

但请务必首先搜索您的发行版存储库...例如,在ubuntu上,catdoc只是一个快速的apt-get。

票数 11
EN

Stack Overflow用户

发布于 2009-03-26 12:32:11

您可以访问OpenOffice via Python API

尝试使用这个作为基础:http://wiki.services.openoffice.org/wiki/Odt2txt.py

票数 9
EN

Stack Overflow用户

发布于 2009-03-26 12:27:43

将Microsoft Office文档转换为超文本标记语言或其他格式的常用工具是mswordview,后来更名为vwWare

如果您正在寻找命令行工具,他们实际上建议使用AbiWord来执行转换:

代码语言:javascript
复制
AbiWord --to=txt

如果你正在寻找一个库,就从wvWare overview page开始吧。他们还维护a list of libraries and tools which read MS Office documents

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/685533

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档