我想用中文搜索pdf的文本。我正在使用CGPDFScanner。我不能用CIDFontType2得到正确的文本。
我的字体对象有ToUnicode条目
HFKAAO+LinGothic-Bold是fontName
它有带有名称标识的CIDToGIDMap条目(pdf文档表示它意味着truetype字体程序是嵌入的)
CIDSystemInfo
注册表是Adobe
排序是同一性
它在带有FontFile2的FontDescriptor过滤器中有FlateDecode条目。
我发现有人说我只是夸大了我从Tj那里得到的短信,但这不管用.我使用zlib来膨胀文本,而且它似乎没有生成正确的数据。
有什么样例代码我可以学习吗?
我刚找到https://github.com/KurtCode/PDFKitten,但它不能用中文.
发布于 2012-05-04 06:29:27
我发现了问题
我只是使用CMap来翻译字符串表单Tj。
我的代码中有一个错误,我解码了CMap
在我修好窃听器后,一切都好
谢谢~
https://stackoverflow.com/questions/10442663
复制相似问题