我的另一个问题提出了一个相关的问题:
是否有ASCII转录的Unicode标准表?例如,德国的ü映射到ue。
用户bobince在评论中提到,其他语言以不同的方式使用相同的字符,我担心他们可能不仅使用相同的字形,而且使用相同的代码点。因此,将"ü“映射到"u”也是可以接受的(通过视觉相似性进行映射)。将ü映射到"u的做法也是如此(例如,参见链接由Juancho发布)。
Juancho发布的链接中显示的方法在技术上是可行的解决方案。然而,这样的映射是否有正式的标准,或者至少是作为准标准的映射?理想情况下,它还应该包括,例如,基于语音学的非拉丁字符的转录。我记得有一个存在于日本,加纳和希腊的字符。在这方面,这也不应该是个大问题。
发布于 2013-06-20 14:07:34
这类映射没有正式的标准。一般处理拉丁文字母的映射(如ü、é和)都映射到Ascii,并不是真正的转录或音译,而是只是,嗯,映射,这可能被称为简化或理解。它们被用于各种目的,通常是以一种特殊的方式进行的。
映射üto ue在德语中相当常见,在不被使用时,可能被称为德语名称的非官方或事实上的标准。但是其他语言使用其他的规则,用这种方式将法语或西班牙语理解为中文是很奇怪的;相反,它将被删除,将ü映射到u。
人们可能会在被迫(或者他们认为自己是被迫的)使用Ascii时,绘制“üto u”的地图,但他们想传达这样的信息,即u在上面有透气。
https://stackoverflow.com/questions/17215431
复制相似问题