首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用pdf2htmlEx工具将pdf转换为html的字体不对齐

使用pdf2htmlEx工具将pdf转换为html的字体不对齐
EN

Stack Overflow用户
提问于 2016-04-26 14:44:05
回答 1查看 880关注 0票数 0

字体问题与PDF到的转换

  1. 所有"ti“、"fi”、"tt“字符都不见了。

样本截图

  1. 字体重叠问题

样本截图

  • 注意:我不理解firefox的这个问题。在safari浏览器中获取铬中的上述问题

I正在使用

  • 使用0.13.6版本的pdf2htmlEX
  • 使用以下命令将pdf转换为html

pdf2htmlEX -拆分-第1页-缩放3-合适宽度920 -正确-文本-可见性1-最-迪尔1美元2美元2>&1

尝试过

使用--fallback 1选项解决了上述所有问题。但

  1. 回退选项降低了文档的清晰度。
  2. 页中的表会消失,而将其替换为空空间。

怀疑

  1. 你能解释一下后面的情况吗?
  2. 我已经试过了上面的(用后盾)。请建议我,如果你喜欢用不同的方法解决上述问题的字体。

使用chrome和safari解决上述问题,而在Firefox中,它工作得很好。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-06-05 07:59:34

上面的问题只发生在像chrome和safari这样的webkit浏览器中,它们提供了连接的支持,而像firefox这样的浏览器却没有。

结扎是两个或多个字母作为单个字形连接在一起的组合。

​根由

这个缺少字符的问题是由于这些现代浏览器提供的捆绑支持--让我来解释一下

1.该工具在转换时--它使用poppler将字符转换为字形以进行呈现--现在这些浏览器在遇到tt ff fi这样的字符时,会认为它们是捆绑的,并搜索对应于tt而不是t的字形。

2.由于它们没有相应的符号--它们只是跳过字符并呈现其他字符--因此,我们找出了丢失的字符。

可以用解决

禁用/关闭这些浏览器中的连接-将css嵌入生成内容中。

欲知更多详情,请参阅:

如果我错了,请纠正我。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36868284

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档