
首先,要理解最左匹配原则,得先知道什么是联合索引。
users 表的 name 字段创建一个索引。users 表的 (last_name, first_name) 两个字段创建一个联合索引。这个索引的结构可以想象成类似于电话簿或字典。电话簿是先按姓氏排序,在姓氏相同的情况下,再按名字排序。你无法直接跳过姓氏,快速找到一个特定的名字。
最左匹配原则指的是:在使用联合索引进行查询时,MySQL/SQL数据库从索引的最左前列开始,并且不能跳过中间的列,一直向右匹配,直到遇到范围查询(>、<、BETWEEN、LIKE)就会停止匹配。
这个原则决定了你的 SQL 查询语句是否能够使用以及如何高效地使用这个联合索引。
假设我们有一个 users 表,并创建了一个联合索引 idx_name_age,包含 (last_name, age) 两个字段。
id | last_name | first_name | age | city |
|---|---|---|---|---|
1 | Wang | Lei | 20 | Beijing |
2 | Zhang | Wei | 25 | Shanghai |
3 | Wang | Fang | 22 | Guangzhou |
4 | Li | Na | 30 | Shenzhen |
5 | Zhang | San | 28 | Beijing |
索引 idx_name_age 在磁盘上大致是这样排序的(先按 last_name 排序,last_name 相同再按 age 排序):
(Li, 30)
(Wang, 20)
(Wang, 22)
(Zhang, 25)
(Zhang, 28)
现在,我们来看不同的查询场景:
SELECT * FROM users WHERE last_name = 'Wang';
last_name。last_name = 'Wang' 的记录((Wang, 20) 和 (Wang, 22))。SELECT * FROM users WHERE last_name = 'Wang' AND age = 22;
last_name = 'Wang',然后在这些结果中快速找到 age = 22 的记录。SELECT * FROM users WHERE last_name = 'Zhang';
last_name,但它是索引的最左列。SELECT * FROM users WHERE age = 25;
last_name。-- 假设我们有一个三个字段的索引 (col1, col2, col3)
-- 查询条件为 WHERE col1 = 'a' AND col3 = 'c';
col1,但跳过了 col2 直接查询 col3。col1 来缩小范围,找到所有 col1 = 'a' 的记录。对于 col3 的过滤,它无法利用索引,需要在第一步的结果集中进行逐行筛选。SELECT * FROM users WHERE last_name > 'Li' AND age = 25;
last_name 使用了范围查询 >。last_name > 'Li' 的记录(即从 Wang 开始往后的所有记录)。但是,对于 age = 25 这个条件,由于 last_name 已经是范围匹配,age 列在索引中是无序的,因此数据库无法再利用索引对 age 进行快速筛选,只能在 last_name > 'Li' 的结果集中逐行检查 age。最左匹配原则的本质是由索引的数据结构(B+Tree) 决定的。索引按照定义的字段顺序构建,所以必须从最左边开始才能利用其有序性。
如何设计好的联合索引?
WHERE 子句的列放在最左边。=)的列放在范围查询(>, <, LIKE)的列左边。原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。