首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何将日语字符归类为汉字、片假名或平假名?

如何将日语字符归类为汉字、片假名或平假名?
EN

Stack Overflow用户
提问于 2011-03-22 16:19:13
回答 1查看 2.8K关注 0票数 3

我正在开发一些需要对日语进行排序的应用程序。

日语排序需要将片假名和汉字转换为平假名,然后根据UTF-8代码进行排序。

平假名、片假名和汉字字符应组合在一起,并按相当于平假名的“拼写”进行排序。注:使用平假名“字母表”- a,i,u,e,o,ka,ki,ku,ke,ki等。

现在,要完成这项任务,我需要:

1.将日语字符分类为汉字、片假名或平假名。

2.将片假名和汉字转换为平假名。

3.应用基于拼音(平假名)的排序算法。

应用程序的数据库采用UTF-8。

现在执行第一步:“将日语字符归类为汉字、片假名或平假名。”,

我想知道在Sqlite3,QT,ICU或任何其他可以提供字符Unicode的软件包中,是否有用于C或C++编程语言的API?

基于Unicode,我们可以很容易地对日文字符进行分类。

如果我说错了,请纠正我。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-03-22 17:17:11

  1. 正如您所说,使用Unicode可以很容易地将日语字符分类到组中。这是片假名到平假名的trivial.
  2. Conversion也是微不足道的,因为有一对一的映射。您可以通过Kakasi
  3. Sorting将汉字转换为平假名,可以先转换为平假名。然而,这是穷人的类型,因为许多汉字都是同音字(相同的发音,不同的汉字)。因此,您应该在按平假名转换和排序之前对汉字进行排序。

您没有说明为什么需要以这种方式进行排序。如果你告诉我们更多关于你的应用程序,也许有一个更好的分类我们可以建议。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5388431

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档