我正在解析一个XML文档,其中包含Sabon字体的私有区域中的字符。这些字符必须被替换,因为字体必须更改为Times。到目前为止一切都很好。
现在,我需要一个替换的字符,看起来像SS (双s,像一个结扎两个s)。我检查了“泰晤士报”,没有找到相应的焦炭。有人知道unicode中是否有这样的东西吗?
发布于 2013-09-06 05:28:08
这是一个有点神秘,但我认为,你看到的字形是一个小的大写字形的“”U+00DF拉丁文小写字母锐利S,通常称为“德国双s”。对于你在评论中提到的这个词来说,这没有什么意义,因为Broussonet是法国博物学家,而法语不使用“”(德语不使用“”外国名字),所以Google发现的很少出现“Brou onet”的地方一定是奇怪的拼写错误。
复制的字符串包含专用代码点,Sabon似乎将其用于小大写。这有点奇怪,因为现在通常使用OpenType特性而不是私有代码点将小大写作为可选择的字形变体包括进来,这些代码点从定义上来说是不可移植的。
这仍然不能解释发生了什么,因为字符串包含“Broussonet”,其中“ss”由Sabon中用于小盘“s”的专用代码点的两个副本表示。据推测,“ss”和“is”之间的某种转换正在某处发生。无论如何,您的第二个注释中的“字符”是U+E03F,这是一个私人使用代码点,显然用于小型大写“CFF字形id germandbls.sc”,在Sabon中。
然而,如果文本被解释为实际上是大写的,第一个字母以外的字母使用小写表示,如果“SS”随后被解释为或被大写形式的“U+1E9E”替换,那么它就是“ẞ”拉丁文大写字母SHARP S,在正常的德语拼写中,“ẞ”映射到“SS”(普通字母“S”的两份副本),但现在Unicode也有U+1E9E,以满足在拼写上保持差异的需要,就像Strauss is中的大写字母一样。现代版本的有一个用于“ẞ”的字形,而旧版本则没有(2008年4月,UnicodeVersion5.1中添加了U+1E9E)。
https://stackoverflow.com/questions/18644869
复制相似问题