在windows中,文档文件以.docx结尾
为了将.docx文件的内容转换成HTML string,我使用了mammoth package,一切都运行得很好。
现在我要面对的是Unix系统中使用LibreOffice的.odt文件。
问题是:有没有像Mammoth这样的包可以把.odt文件转换成超文本标记语言?
如果没有选择,也许我不得不从.odt文件转换为.docx文件,只是为了重复使用猛玛象。有没有可以做到这一点的python包?
提前谢谢你!
发布于 2020-06-16 02:23:21
您是否尝试过查看https://pypi.org/project/odfpy/包?对于操作ODT文件,它似乎是一个非常方便的包装器。
更具体地说,在这个包中似乎有一个函数/ API,它允许您将ODT文件转换为某种形式的HTML,因此请尝试查看它。
odf2xhtml -在包链接上将odf2xhtml转换为(X)HTML应该会指引您正确的方向。祝你好运!
https://stackoverflow.com/questions/62394505
复制相似问题