首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >CMap中的PDF - Ligature映射

CMap中的PDF - Ligature映射
EN

Stack Overflow用户
提问于 2015-07-07 16:38:54
回答 1查看 201关注 0票数 1

我有一个pdf,它有以下映射:

代码语言:javascript
复制
<019A> <0074>
<039E> <00A9>
<019F> <00740069>
<01B5> <0075>
<01C0> <0076>
<01C7> <0079>
<03EC> <0030>

映射cid <019F>表示连字ti。

在映射\u0074 -> t和\u0069 -> i(因此)连接ti时。

如何获取实际的连字unicode?或者我必须保留这种模式的轨迹,并用连字的实际unicode替换cid映射?

谢谢。

EN

回答 1

Stack Overflow用户

发布于 2019-04-20 17:33:32

从本质上讲,对于每个字符代码,不能假定映射中只有一个unicode字符。您必须获取这两个字符的输出。在unicode中,它甚至可以是两个以上的字符。有些字体也有"ffl“的连字。

这里还要注意的是,Unicode规范还为连字定义了特殊的单字符:https://en.wikipedia.org/wiki/Typographic_ligature,可以在映射中使用特殊的连字unicode字符。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31263701

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档