首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Nodejs检测双码IDN语言

Nodejs检测双码IDN语言
EN

Stack Overflow用户
提问于 2021-06-10 02:17:06
回答 1查看 122关注 0票数 0

我知道有像bestiejs/minycode.jsNodeJS PunnyCode这样的库来转换小代码,但是我找不到任何能检测到小代码语言的库(Geek、Chinese等)。

是可以本地检测到小代码语言,还是必须使用不同的软件来检测这些语言。

另外,是否有任何NodeJs库可以用于检测弱小代码语言?

EN

回答 1

Stack Overflow用户

发布于 2022-04-26 08:16:33

该子代码是基于16位Unicode的国际化域名的ASCII (8位)表示。转换成子码被称为可变长度编码,是一个数学过程,涉及到额外的处理过程,如案例折叠和规范化到Unicode格式C。由于小代码的数学性质,语言信息本身根本不应该是小代码表示的一部分。在特定的Unicode范围/块中,给出了它自己的脚本/语言,这是与给定的子代码等价的Unicode。

因此,如果一个人需要有IDN的语言/脚本检测能力,那么它需要首先转换为它的U标签形式,然后传递到语言/脚本检测例程。

若要了解不同编程语言中可用于将双码转换为各自Unicode标签的各种库,请参阅“通用验收指导小组”创建的以下两个文档

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67913755

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档