我想获得一个ppt文件中的内容(纯文本)。该怎么做呢?
(如果我想获取txt文件中的内容,我只需要打开并阅读。我需要做什么才能从ppt文件中获取信息?)
顺便说一下,我知道windows系统中有一个win32com。但是现在我在linux上工作,有没有可能呢?
发布于 2012-11-27 04:44:27
我在Superuser上找到了这个讨论
Command line tool in Linux to Extract Text From Word, Excel, Powerpoint?
这里列出了几个合理的答案,包括使用LibreOffice来做这件事(对于.doc、.docx、.pptx等),以及Apache Tika Project (它看起来像是这个解决方案空间中的5000磅大猩猩)。
https://stackoverflow.com/questions/13565542
复制相似问题