首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >检查两种变体中哪一种是繁体中文,哪种是简体中文

检查两种变体中哪一种是繁体中文,哪种是简体中文
EN

Stack Overflow用户
提问于 2011-03-21 13:34:28
回答 1查看 355关注 0票数 1

我从谷歌地图应用程序接口得到的结果不一致,

代码语言:javascript
复制
|Head southwest on 吳江路/吴江路 toward 泰兴路/泰興路 
|Head southwest on TRAD/SIMP toward SIMP/TRAD

目前我正在用这个正则表达式([^\u0000-\u0080]|/)+匹配中文单词

然后我分解匹配,让配对吳江路 vs 吴江路,去掉常见的字符,有没有办法区分中的哪一个是繁体字符或简体字符?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-03-21 13:48:29

您需要一个传统的->简化的Unicode映射表。用谷歌搜索一下,你会很容易找到的。如果找不到,那么可以通过下载Big5->GB映射表,然后将两端转换为Unicode (通过Big5->Unicode和GB->Unicode映射表,这两个映射表都很容易获得)来创建一个。

如果您在“简体”部分找到一个字符,那么它很可能是一个简体字符(因为繁体字符映射到这里)。

注意,这不是一种科学方法,因为多个繁体字符可能映射到单个简体字符,并且该简体字符可能与繁体字符相同。在这种情况下,您需要决定是否将其称为传统。

例如,在简体中,後有时被映射为后,但它也与繁体字符"queen“相同。

如果只是映射成对的字符,可以尝试在两个方向上查找转换。您最多只能在一个方向上找到一个转换,这就是您的答案。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5374186

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档