好吧,所以我需要的是很清楚的解释。
与使用.sort的方式相同,为了按字母顺序/字典顺序对一个基于拉丁文的字符串数组进行排序,我正在寻找一种对非拉丁UTF-8字符串进行排序的方法。
特指:
所谓“排序”,我指的是你通常在字典里找到它们的方式。(我知道这对中国/日本人来说可能要棘手得多,所以让我们先看看剩下的吧)
有什么想法吗?
我对音译不感兴趣(这就是我目前正在做的),因为结果远不是“正确的”--从字典学上讲.
注:这与RoR无关。纯粹的露比。
发布于 2015-10-25 16:03:25
正如您注意到的,Unicode排序是一件棘手的事情--您几乎肯定不想自己去做。
Unicode处理库的爸爸是icu。有相当多的红宝石绑定为icu,其中许多看起来相当老,但ffi-icu似乎是相当活跃的。
Twitter还维护了推特-cldr-rb,它声称拥有一个完全实现Unicode排序算法的纯红宝石。
https://stackoverflow.com/questions/33331583
复制相似问题