我试图在scala语言中使用stripAccent函数从泰语单词中剥离重音,但似乎无法剥离重音。
import org.apache.commons.lang3.StringUtils.stripAccents
println("stripped string " + stripAccents("CLEกอ่ตัRงขึนในปีR"))
stripped string CLEกอ่ตัRงขึนในปีR我在Intellij windows环境中运行。它剥离了许多其他语言,如德语,荷兰语等。有人遇到过类似的问题吗,你是如何解决的?
发布于 2021-02-04 20:07:51
您可以使用java Normalizer:
import java.text.Normalizer
val thaiString = "CLEกอ่ตัRงขึนในปีR"
val strippedString = Normalizer.normalize(thaiString, Normalizer.Form.NFD)
.replaceAll("[\\p{InCombiningDiacriticalMarks}\\p{IsM}]+", "")
println(strippedString)
//CLEกอตRงขนในปRhttps://stackoverflow.com/questions/66044584
复制相似问题