我使用MarkLogic为PDF文档生成XML文件,其中包含图像、格式文本(斜体和粗体)、表格等。请您提供一些最佳转换指南。我使用的是以下管道的正常转换:
Processing
图像没有维护,其标题和格式也没有维护。表在生成的XML中以正常段落的形式出现。
发布于 2012-04-27 13:59:59
文档转换的一部分是构建CSS文件来处理格式,以及抓取文档中的图像。都会进入数据库。使用浏览器查看文档时,请确保指向图像和CSS的链接正常工作。您可能需要将它们从/doc1.css改为类似/get.xqy?uri=doc1.css。另外,页面上的其他CSS可能会干扰文档的CSS。
https://stackoverflow.com/questions/10349189
复制相似问题