可能重复: 用Python读写MS Word文件
我正在研究一个需求管理系统(就像requiste Rational )--并且需要在windows或Apple环境中通过一个搜索特定标签的MS文档来阅读。是否有任何已知的框架(我找不到)-或建议的方法?
为了增加一些澄清--这不是一次性阅读,每次对文档进行更新时,我都会检查它,并对需求特定的区域执行CRUD。
发布于 2009-05-26 14:03:33
首先,将其从本机Word (.doc)格式中删除。
.doc文件。他们几乎不会注意到不同之处--只是文件更大。
使用lxml或元素树解析XML并查找标题、节、段落和列表。一旦有了解析结构(XML或HTML),就可以分析文档,寻找特定的标记。
发布于 2009-05-26 15:40:53
您可以基于openoffice.org读取Word文档的能力。Python-UNO桥允许使用来自python脚本语言的标准OpenOffice.org API。使用Python-UNO并在机器上拥有openoffice的相关部分,阅读大多数Word文档应该是非常简单的。
发布于 2009-05-26 16:02:58
使用工具(VSTO),可以从任何.NET语言编写.NET脚本。如何:在文档中搜索文本示例显示了C#和Visual Basic代码,但是IronPython也可以调用相同的.NET方法。
如果您准备使用IronPython (没有Mac等效),这可能是Word文档中搜索的一种特定于Windows的解决方案。
https://stackoverflow.com/questions/910730
复制相似问题