我有一个字符串,可以是一个英文单词,也可以是一个CJK字符。我可以保证这个字符串是UTF-8编码的。我在perl脚本中工作。
更高级别的问题是我有一个类似于上面描述的字符串数组。我正在做一个连接“”@array。我想知道当它是CJK的时候不要添加空格。
因此,对于CJK,我将只执行join "“@array。
我环顾四周,但找不到这个确切的问题。
谢谢。
发布于 2011-06-13 23:17:36
您可以使用正则表达式\p{InCJK_Unified_Ideographs}。这是一个Unicode块(与Unicode脚本相反,后者也受Perl支持,但似乎与您的问题描述不匹配)。
还有一些其他的候选块,如扩展A和偏旁补充。Here's a full list。
https://stackoverflow.com/questions/6332303
复制相似问题