我使用数据库的文件,内容从5页到20页的文本数据。
我有三项任务:
我尝试使用Wayne (pdf@ros.co.nz)的PHP库,并向其中添加了许多正则表达式。我添加了许多PDF文本格式操作符,像Ts, TL, T*, Tc, Tw, Tz和我几乎完成了,但我不能达到字符的符号以外的类型1字符表,我不知道如何从字体文件中获取'kern‘和'hmtx’表?如何嵌入字形?
我相信,我可以通过矩阵转换PDF文本指令来进行分类:
[ (A) 120 (W) 120 (A) 95 (Y again) ] TJUPD#1: MinionPro字体没有'kern‘表。它有'GPOS‘(字形定位表),我非常接近解决这个问题。顺便说一句,通过PHP在二进制文件中行走是一场噩梦((
发布于 2012-08-01 16:56:11
在小字体文本字符串中使用手动角化是完全错误的策略。Microsoft文本导出程序也会这样做,结果是不可接受的。
https://stackoverflow.com/questions/11595496
复制相似问题