首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >BreakIterator ICU -获取字形簇的字节长度

BreakIterator ICU -获取字形簇的字节长度
EN

Stack Overflow用户
提问于 2015-02-03 16:49:47
回答 1查看 381关注 0票数 1

当使用来自ICU的BreakIterator时,是否有一种方法可以在输入字符串的第n个边界处检索字素集群的字节长度(或代码单位长度)?理想情况下,使用最少数量的API调用。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-03-06 00:12:37

自我回答:

如果您知道以代码单位表示的当前索引,那么可以使用ICU::ubrk_current()返回ICU::ubrk_next()最近返回的current索引。请参阅:8h.html#a4f8b67527c5c9d9205a3446506ffeefc

我对UBreakIterator方法描述中的含糊不清感到困惑。但是,在与ICU支持联系后,“字符索引”在这种情况下等同于代码单元索引。

有了这些信息,一个简单的实现如下:

代码语言:javascript
复制
(ubrk_current(m_breakIterator) - currentIndexInCodeUnits) * INTERNAL_ENCODING_BYTE_LENGTH;
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28304321

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档