文章/答案/技术大牛

发布

社区首页 >问答首页 >如何将日语字符归类为汉字、片假名或平假名？

问如何将日语字符归类为汉字、片假名或平假名？
EN

Stack Overflow用户

提问于 2011-03-22 16:19:13

回答 1查看 2.8K关注 0票数 3

我正在开发一些需要对日语进行排序的应用程序。

日语排序需要将片假名和汉字转换为平假名，然后根据UTF-8代码进行排序。

平假名、片假名和汉字字符应组合在一起，并按相当于平假名的“拼写”进行排序。注:使用平假名“字母表”- a，i，u，e，o，ka，ki，ku，ke，ki等。

现在，要完成这项任务，我需要：

1.将日语字符分类为汉字、片假名或平假名。

2.将片假名和汉字转换为平假名。

3.应用基于拼音(平假名)的排序算法。

应用程序的数据库采用UTF-8。

现在执行第一步：“将日语字符归类为汉字、片假名或平假名。”，

我想知道在Sqlite3，QT，ICU或任何其他可以提供字符Unicode的软件包中，是否有用于C或C++编程语言的API？

基于Unicode，我们可以很容易地对日文字符进行分类。

如果我说错了，请纠正我。

unicode

sqlite

cjk

icu

sorting

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-03-22 17:17:11

正如您所说，使用Unicode可以很容易地将日语字符分类到组中。这是片假名到平假名的trivial.
Conversion也是微不足道的，因为有一对一的映射。您可以通过Kakasi
Sorting将汉字转换为平假名，可以先转换为平假名。然而，这是穷人的类型，因为许多汉字都是同音字(相同的发音，不同的汉字)。因此，您应该在按平假名转换和排序之前对汉字进行排序。

您没有说明为什么需要以这种方式进行排序。如果你告诉我们更多关于你的应用程序，也许有一个更好的分类我们可以建议。

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/5388431

复制

相似问题

问如何将日语字符归类为汉字、片假名或平假名？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将日语字符归类为汉字、片假名或平假名？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将日语字符归类为汉字、片假名或平假名？
EN