我想使用正则表达式来识别文本是中文、日文还是德文。
例如,我有一些类似于"MainWindow_Button_save“的文本。
它的德语翻译是"MainWindow_Button_sparen“。
它的中文翻译是"MainWindow_Button_保存“。
日语是"MainWindow_Button_保存“。
我想要一个正则表达式,它可以找到前缀"MainWindow_Button,并确定下面的文本是否为中文/日文/德文。我不太关心这篇文章。我唯一关心的是它是用哪种语言编写的。
我所做的就是这个"^MainWindow_Button_[^a-zA-Z]*",但是我如何识别语言呢?
发布于 2014-09-30 13:31:24
我尝试在示例here中使用正则表达式
我建议获取中文/日文的第一个和最后一个字符,并将其放入正则表达式“MainWindow_Button_()+”中,这样它就可以匹配任何中文/日文字符
如果不使用正则表达式,我建议使用其他方法,如下所示:
读取"MainWindow_Button_“后第一个字符的Unicode值,并验证Unicode值属于中文字符集还是日文字符集,如果两者都不在,则它将是德文字符集。
发布于 2014-12-22 14:03:57
以下正则表达式将有助于提供文本是否为中文或日文的验证:^\u3000-\u9FFF +$
https://stackoverflow.com/questions/26113279
复制相似问题