首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用Ruby对非拉丁字符串进行排序

用Ruby对非拉丁字符串进行排序
EN

Stack Overflow用户
提问于 2015-10-25 15:42:54
回答 1查看 843关注 0票数 0

好吧,所以我需要的是很清楚的解释。

与使用.sort的方式相同,为了按字母顺序/字典顺序对一个基于拉丁文的字符串数组进行排序,我正在寻找一种对非拉丁UTF-8字符串进行排序的方法。

特指:

  • 西里尔
  • 希腊语
  • 中国人
  • 日语
  • 阿美尼亚语
  • 泰语
  • 格鲁吉亚语
  • 希伯来语
  • 阿拉伯语

所谓“排序”,我指的是你通常在字典里找到它们的方式。(我知道这对中国/日本人来说可能要棘手得多,所以让我们先看看剩下的吧)

有什么想法吗?

我对音译不感兴趣(这就是我目前正在做的),因为结果远不是“正确的”--从字典学上讲.

注:这与RoR无关。纯粹的露比。

EN

回答 1

Stack Overflow用户

发布于 2015-10-25 16:03:25

正如您注意到的,Unicode排序是一件棘手的事情--您几乎肯定不想自己去做。

Unicode处理库的爸爸是icu。有相当多的红宝石绑定为icu,其中许多看起来相当老,但ffi-icu似乎是相当活跃的。

Twitter还维护了推特-cldr-rb,它声称拥有一个完全实现Unicode排序算法的纯红宝石。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33331583

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档