首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >CGPDFScanner、Identity-H和解压

CGPDFScanner、Identity-H和解压
EN

Stack Overflow用户
提问于 2011-05-18 16:07:30
回答 1查看 636关注 0票数 0

我的CGPDFScanner实例正在扫描一个测试pdf文件。

在给定时间,当前字体字典具有EncodingIdentity-H和具有关键字FontFile2FontDescriptor字典。这个键恰好是一个流值,它的字典中有键Filter。此键的值为FlateDecode

我不确定如何解释和使用它(例如,将下一个Tj块中的文本提取为Unicode)。例如,我是否只需对下一个Tj块中的字节进行zlib-解压缩?(这里没有ToUnicode密钥。)

我以为所有的解压缩都是由CGPDFScanner实例执行的。

EN

回答 1

Stack Overflow用户

发布于 2011-05-18 18:30:00

如果字体使用Identity-H编码,并且没有ToUnicode条目,则无法提取文本。Tj运算符的参数是一个字形索引序列,如果没有ToUnicode条目,则无法将此序列转换为文本。

FontFile2条目存储实际的字体文件,它在从PDF文件中提取文本时没有任何作用。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/6041628

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档