首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >utf8_unicode_ci和utf8mb4_0900_ai_ci有什么不同

utf8_unicode_ci和utf8mb4_0900_ai_ci有什么不同
EN

Stack Overflow用户
提问于 2019-02-26 20:04:30
回答 1查看 15.5K关注 0票数 19

在mysql中,utf8mb4_0900_ai_ciutf8_unicode_ci数据库文本编码有什么不同(特别是在性能方面)?

更新:

utf8mb4_unicode_ci和utf8mb4_0900_ai_ci之间有相似的区别吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-03-07 00:16:16

  • 编码是相同的。也就是说,字节看起来是一样的。
  • 字符集是不同的。utf8mb4有更多的characters.
  • The排序规则(如何进行比较)是不同的。
  • 性能是不同的,但这很少有关系。

utf8_unicode_ci表示CHARACTER SET utf8,它只包含1字节、2字节和3字节的UTF8字符。因此,它排除了大部分Emoji和一些中文字符。

utf8mb4_unicode_ci意味着CHARACTER SET utf8mb4是对应于4字节CHARACTER SET utf8mb4COLLATION

Unicode组织多年来一直在改进该规范。下面是从其“版本”到MySQL排序规则的映射:

代码语言:javascript
复制
4.0   _unicode_
5.20  _unicode_520_
9.0   _0900_

大多数差异将出现在大多数人从未遇到过的领域。一个例子:在某种程度上,一个变化允许以某种方式区分和排序Emoji。

后缀(MySQL doc):

代码语言:javascript
复制
_bin      -- just compare the bits; don't consider case folding, accents, etc
_ci       -- explicitly case insensitive (A=a) and implicitly accent insensitive (a=á)
_ai_ci    -- explicitly case insensitive and accent insensitive
_as (etc) -- accent-sensitive (etc)

性能:

代码语言:javascript
复制
_bin         -- simple, fast
_general_ci  -- fails to compare multiple letters; eg ss=ß, so somewhat fast
...          -- slower
_900_        -- (8.0) much faster because of a rewrite

但是:排序的速度通常是查询中最小的性能问题。INDEXesJOINs、子查询、表扫描等对性能更为关键。

票数 38
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54885178

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档