我正在寻找一个小的C库来处理utf8字符串。
具体地说,是基于unicode分隔符的拆分,用于词干分析算法。
相关帖子建议:
ICU http://www.icu-project.org/ (我发现它对于我在嵌入式设备上的用途来说太笨重了)
UTF8-CPP:http://utfcpp.sourceforge.net/ (很好,但C++不是C)
有没有人发现了一些独立于平台的小代码库来处理unicode字符串(不需要进行归化)。
发布于 2008-11-24 06:52:10
我成功使用的一个很好的、轻量级的库是utf8proc。
发布于 2011-10-30 20:28:41
也有MicroUTF-8,但它可能需要登录凭据才能查看或下载源代码。
发布于 2008-11-24 07:30:02
UTF-8是专门设计的,因此许多面向字节的字符串函数可以继续工作,或者只需要进行较小的修改。
例如,只要两个输入都是有效的、以null结尾的strstr -8字符串,C的UTF函数就可以完美地工作。只要输入字符串开始于字符边界(例如,strstr).的返回值),strcpy就可以正常工作
所以你可能甚至不需要一个单独的库!
https://stackoverflow.com/questions/313555
复制相似问题