首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >"utf8_unicode_ci“和"utf8_persian_ci”有什么区别?

"utf8_unicode_ci“和"utf8_persian_ci”有什么区别?
EN

Stack Overflow用户
提问于 2021-10-18 15:16:06
回答 1查看 87关注 0票数 0

在MySQL数据库中,我将波斯语句子作为Unicode(utf8_unicode_ci)保存在一个表中。然后我将排序规则更改为utf8_persian_ci,但结果是相同的。未做任何更改。

"utf8_unicode_ci“和"utf8_persian_ci”有什么区别?

EN

回答 1

Stack Overflow用户

发布于 2021-10-31 01:36:46

(我不能作为专门针对波斯语校对的权威人士发言。)MySQL排序规则背后的一般思想是

  • _bin --只检查位;这通常对"words".
  • _general_ci无用--不区分大小写和重音,当涉及到所有其他'rules'.
  • _unicode_ci,_unicode_520_ci,_0900_ai_ci --不区分大小写和重音时,就相当差劲了;基于Uniocde标准4.0.0,5.2.0,9.0.0;但不太可能对任何特定语言(西班牙语、波斯语、德语、etc)
  • _persian_ci (等))“正确”--类似于Unicode排序规则之一,但针对该语言进行了调整。

下面是一个特定排序规则如何不同的示例:

与大多数collations

  • _spanish2_ci一样,
  • _spanish_ci将"ch“视为两个字母:'cz‘< 'ch’< 'da‘。(和其他differences.)
  • _lithuanian_ci -- "ch“与”c“相同;即'cha‘=’ca‘。

我假设_persian_ci和_unicode_ci在波斯语字符上可能有所不同。看一眼http://mysql.rjweb.org/utf8_collations.htmlhttp://mysql.rjweb.org/utf8mb4_collations.html,似乎可以看出西欧字符在这些排序规则中的排序方式是相同的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69618502

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档