BreakIterator.getWordInstance()的文档提供了将其与Locale参数一起使用的选项,这可能是因为不同的Locale方法的最终结果可能会因(WordInstance,LineInstance,SentenceInstance,CharacterInstance)等方法而异。
但是,当我不使用这个参数时,我得到的结果仍然与在getAvailableLocales()中使用任何语言环境调用它时得到的结果相同。
是否存在某种模式、字符串或区域设置导致这些方法产生不同的结果?
发布于 2016-09-08 03:19:48
我相信所有的“西方”语言都有相同的规则。
粗略扫描一下就会发现,本地语言环境(泰语)有自己的规则,这些规则在.../jre/lib/ext/localedata.jar中的文件/sun/text/resources/th/WordBreakIteratorData_th中给出。
这是一个二进制文件,所以我不知道它说的是什么,即使我能理解这个文件,即使我不懂泰语,我也不会理解它。
https://stackoverflow.com/questions/39376733
复制相似问题