我使用pdf2htmlEX将pdf转换成html,当它在mac上本地生成时,输出会正确显示,而在amazon上生产时则不会显示。多个页面都有这个问题,但是我将使用这个pdf格式的第22页作为一个具体的例子。
对于不正确的html输出(在linux上生成):
visibility属性(由类名ff13指定)设置为hidden引起的,在正确的转换中,它被设置为visible。rendered fonts的css样式计算选项卡下,我可以看到正确的字体是DejaVu Sans,而不正确的字体是Helvetica。我检查并确认DejaVuSans.ttf (和其他DejaVu字体)安装在/usr/share/fonts/dejavu/的linux机器上,所以我最好的猜测是,由于某种原因,pdf2htmlEX程序在进行转换时无法找到字体文件,因此它将css visibility属性标记为hidden。我还试图安装核心mac (源代码这里)和微软字体,重新启动机器,然后再试一次,但这似乎没有帮助。
有没有人知道如何解决这个问题,或者从这里解决问题?提前感谢您的帮助!
发布于 2020-03-08 12:42:50
您需要确保所有未嵌入PDF字体的字体文件都在fontconfig路径中。您可以在fontconfig配置文件中看到路径列表(通常是/etc/fonts/fonts.config)。查看此文件的顶部以获得目录列表。如果您的字体文件不在其中之一,那么它将不会被找到。
在您的例子中,我会将字体文件移到/usr/share/fonts中,而不是在子目录中。
https://stackoverflow.com/questions/60582548
复制相似问题