我有一个PDF,我试图使用CGPDFScanner扫描PDF。在扫描pdf时,当遇到单词"file“时,CGPDFStringGetBytePtr API返回"\x02le”。PDF有Type1字体,没有ToUnicodeMapping(CMap)。编码字典不存在于PDF中,因此使用NSUTF8String编码。然而,我尝试了所有的NSMacOSRomanStringEncoding,NSASCIIStringEncoding,但没有运气。有什么问题吗?
谢谢。
发布于 2015-05-08 14:23:40
代码\x02对应于'fi‘字符串。'fi‘序列是用一个连接来绘制的--这就是为什么只有一个字符代码的原因。
代码和字符串之间的对应是在字体编码中完成的。字体编码包含一个/Differences数组,该数组指定代码\x02和序列'fi‘之间的映射。
https://stackoverflow.com/questions/30118358
复制相似问题