我需要将数千个.doc文件转换成HTML。这些文档包含MathType方程、字图(矢量图)和多次包含更多方程对象本身。
通过Microsoft.Office.Interop.Word,我设法将.docs保存到已过滤的HTML和“未过滤的”HTML (最后一种模式具有生成多个.wmz文件的优点)。遗憾的是,SDK无法转换在过程中生成的wmz文件中的每个等式( MathType附带的wmf示例被转换为LaTeX )。总结:
所有这些都必须是自动化的,因为有数千个文件。
有人在这方面有经验吗?
发布于 2013-05-10 10:28:26
WMZ是gzipped WMF,所以如果WMF到LaTeX的转换有效,那么尝试将WMZ文件转换为WMF,然后将其转换为LaTeX。
https://stackoverflow.com/questions/15581708
复制相似问题