首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >处理用于代替拉丁字符的西里尔字母

处理用于代替拉丁字符的西里尔字母
EN

Stack Overflow用户
提问于 2012-09-03 18:17:41
回答 1查看 182关注 0票数 1

我们最近有一个用户输入英文文本,但似乎是在为西里尔文设置的计算机上完成的,因为一些字母,如" A“,实际上是西里尔文小写字母A,而不是拉丁文小写字母A。

我以为normalising会把西里尔文转换成拉丁文的等价物,但事实并非如此(我猜它们只是在显示方式上是等同的,而不是它们的意思)。

这是一个常见的问题吗?如果用户的电脑设置为使用西里尔字母,那么他们可能正在写英语,但是却使用了西里尔字母?

通常情况下,什么是发现这种情况并进行适当转换的安全方法?

EN

回答 1

Stack Overflow用户

发布于 2012-09-04 00:01:58

要检测西里尔文,只需使用正则表达式match \p{IsCyrillic}。一种更通用的方法是搜索任何非拉丁字符。如果有匹配的字符,则需要将这些字符替换为与其对应的拉丁字符。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12245916

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档