我正在开发一些需要对日语进行排序的应用程序。
日语排序需要将片假名和汉字转换为平假名,然后根据UTF-8代码进行排序。
平假名、片假名和汉字字符应组合在一起,并按相当于平假名的“拼写”进行排序。注:使用平假名“字母表”- a,i,u,e,o,ka,ki,ku,ke,ki等。
现在,要完成这项任务,我需要:
1.将日语字符分类为汉字、片假名或平假名。
2.将片假名和汉字转换为平假名。
3.应用基于拼音(平假名)的排序算法。
应用程序的数据库采用UTF-8。
现在执行第一步:“将日语字符归类为汉字、片假名或平假名。”,
我想知道在Sqlite3,QT,ICU或任何其他可以提供字符Unicode的软件包中,是否有用于C或C++编程语言的API?
基于Unicode,我们可以很容易地对日文字符进行分类。
如果我说错了,请纠正我。
发布于 2011-03-22 17:17:11
您没有说明为什么需要以这种方式进行排序。如果你告诉我们更多关于你的应用程序,也许有一个更好的分类我们可以建议。
https://stackoverflow.com/questions/5388431
复制相似问题