相信没有人会故意创建重复的冗余的索引,很多重复和冗余的索引都是在不经意间创建的,今天松哥来和大家捋一捋这个问题。
因为我们日常在使用 MySQL 的过程中,基本上都是使用 InnoDB 引擎,所以接下来的讨论主要是基于 InnoDB 引擎的 B+Tree 索引来讨论,其他的哈希索引全文索引等不在讨论范围种。
1. 与联合索引重复
在前面的文章中,松哥通过好几篇文章和大家分享了联合索引,包括它涉及到的覆盖索引、前缀匹配等等,联合索引好用,但是对联合索引理解不到位的话,可能会创建出如下的重复索引:
CREATE TABLE `user2` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT,
`username` varchar(32) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
`address` varchar(32) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
`password` varchar(32) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
`email` varchar(16) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `user_index1` (`username`,`address`),
KEY `user_index2` (`username`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
可以看到,这里创建了两个索引:
- user_index1:这个索引包含两个字段,username 在前 address 在后。
- user_index2:这个索引包含一个字段 username。
在[其实 MySQL 中的 like 关键字也能用索引!]一文中,松哥跟大家聊了索引的最左匹配原则,即:
(username,address) 索引既可以当成联合索引来用,也可以通过最左匹配原则当成单独的 (username) 索引来用。
所以,如果再为 username 字段单独创建一个索引就没有必要了,这反而会导致增删改的时候速度变慢。
不过怎么说呢,上面这个结论适用于 99% 的场景,可能会有一些特殊情况,例如想把 (username) 和某一个特别长的字段建立一个联合索引,此时如果单独使用 username 字段进行搜索的话,效率可能降低,此时视搜索的重要程度,看是否需要创建一个重复的索引。
2. 主键加入联合索引中
来看看下面这个索引:
CREATE TABLE `user2` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT,
`username` varchar(32) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
`address` varchar(32) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
`password` varchar(32) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
`email` varchar(16) COLLATE utf8mb4_unicode_ci DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `user_index` (`username`,`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
一个名为 user_index
的索引中包含了两个字段 username 和 id,其中 id 是主键。
在[什么是 MySQL 的“回表”?]一文中,松哥和大家聊了,索引按照物理存储方式可以分为聚簇索引和非聚簇索引。
我们日常所说的主键索引,其实就是聚簇索引(Clustered Index);主键索引之外,其他的都称之为非主键索引,非主键索引也被称为二级索引(Secondary Index),或者叫作辅助索引。
对于主键索引和非主键索引,使用的数据结构都是 B+Tree,唯一的区别在于叶子结点中存储的内容不同:
- 主键索引的叶子结点存储的是一行完整的数据。
- 非主键索引的叶子结点存储的则是主键值以及索引列的值。
这是两者最大的区别。
既然主键已经存在于叶子结点中,那当然没有在联合索引中加入主键了。
好啦,几个小小的注意点,希望能给小伙伴们启发。
参考资料:
- 《高性能 MySQL》
共同学习,写下你的评论
评论加载中...
作者其他优质文章