我们收到wordml文档,这些文档基本上是从msword文档生成的XML文件,其中也包含所有格式化指令。现在我们需要将这些文件转换为PDF。我看过iText的xmlworker来做这个转换。它所做的是简单地删除所有的XML标签,并给我所有的内容作为PDF中的单个段落,没有格式。
如何确保生成的PDF包含此wordml文档中格式正确的文本。
发布于 2015-11-05 03:19:51
iText的产品XMLWorker要求您手动处理每个XML元素(除非您有HTML作为输入)。MS Word文档的XML模式极其复杂,因此您可能需要花几年的时间才能得到看起来几乎没有问题的东西。简而言之,XMLWorker并没有做你认为它做的事情。
如果你想要MS Word到PDF的转换,你需要另一种解决方案。XDocReport (麻省理工学院许可证)就是其中之一,它有用于iText 2 (LGPL许可证)和iText 5 (AGPL许可证)的插件。然而,结果并不完美。
https://stackoverflow.com/questions/33519508
复制相似问题