首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >C#中正则表达式中的外语字符

C#中正则表达式中的外语字符
EN

Stack Overflow用户
提问于 2015-01-27 02:54:12
回答 2查看 16.6K关注 0票数 17

在C#代码中,我尝试传递中文字符:" 中文ABC123"

当我使用字母数字时,通常使用"^[a-zA-Z0-9\s]+$"

它不能作为"中文ABC123"传递,并且正则表达式验证失败。

我还需要为C#添加哪些表达式?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-01-27 02:55:55

要匹配来自任何语言的任何字母字符,请执行以下操作:

代码语言:javascript
复制
\p{L}

如果您还想匹配数字:

代码语言:javascript
复制
[\p{L}\p{Nd}]+

\p{L} ...匹配unicode类别字母的字符。

它是\p{Ll}\p{Lu}\p{Lt}\p{Lm}\p{Lo}的缩写

\p{Ll} ...匹配小写字母。(abc)

\p{Lu} ...匹配大写字母。(ABC)

\p{Lt} ...匹配大小写字母。

\p{Lm} ...匹配修饰符字母。

\p{Lo} ...匹配不区分大小写的字母。(中文)

\p{Nd} ...匹配unicode类别的十进制数字的字符。

只需用^[\p{L}0-9\s]+$替换:^[a-zA-Z0-9\s]+$即可

票数 38
EN

Stack Overflow用户

发布于 2019-06-15 02:55:05

感谢@Andie2302指出了正确的方法。

此外,对于世界上许多语言来说,它仍然具有需要主字符才能生成它的‘加法字符’(例如。泰语单词'เก็บ‘如果只使用\p{L}它将只显示'เกบ',您可以看到单词中缺少一些符号)。

这就是为什么只有\p{L}不能适用于所有外语的原因。

所以,你需要使用下面的代码来支持几乎所有的外语

代码语言:javascript
复制
\p{L}\p{M}

注意:

L代表' letter‘(来自所有语言的所有字母,但不包括'Mark')

M代表'Mark‘( 'Mark’不能单独显示,需要'Letter‘才能显示)

除了需要数字之外,还可以使用以下代码

代码语言:javascript
复制
\p{N}

注意:

N代表'Numeric‘

感谢这个网站提供了非常有用的信息

https://www.regular-expressions.info/unicode.html

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28156769

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档