创建高性能索引
选择正确的索引顺序
在选择索引的顺序的时候有一个原则:将索引选择性最高的列放在左侧,同时索引的顺序要与查询索引的顺序一致,并且要兼顾考虑排序和分组的需要 。在一个多列B树多列中索引的顺序意味着索引首先按照最左侧的列进行排序 , 其次是第二列 。所以无论是where语句还是order by语句都需要尽量满足这个顺序 , 这样才能更好的使用索引 。
索引的选择性
列的选择性高的含义是通过这一列能够更多的过滤掉无用的数据,举个极端的例子,如果把自增id建成索引那么它的选择性是最高的 , 因为会把无用的数据都过滤掉,只会剩下一条有效数据 。我们可以通过下面的方式来简单衡量某一个列的选择性:
select count(distinct columnA)/count(*)as selectivity from table
当上面的数据越大的时候意味着columnA的选择性越高 。这种方式提供了一个衡量平均选择性的办法,但是也不一定是有效的,需要具体情况具体分析 。
前缀索引
当遇到特别长的列 , 但又必须要建立索引的时候可以考虑建立前缀索引 。前缀索引的含义是把某一列的前N个字符作为索引 , 创建前缀索引的方式如下:
alter table test add key(columnA(5));
【如何构建高性能mysql索引】
上面这个语句就是columnA的前5个字符建为前缀索引 。前缀索引是一种使索引更小、更快的有效办法 。但是前缀所有有一个缺点:MySQL无法使用前缀索引来做order by和group by,也无法使用前缀索引做覆盖扫描 。
聚簇索引和非聚簇索引
聚簇索引
聚簇索引代表一种数据的存储方式,表示同一个结构中保存了B-Tree索引和数据行 。也就是说当建立聚簇索引的时候实际的数据行存放在索引的叶子节点上 。这也决定了每个表只能有一个聚簇索引 。
聚簇索引组织数据的方式如下图所示:
从图中可以看到索引的叶子节点和数据行是存放在一起的,这样的好处是可以直接读取到数据行 。在创建表的时候如果我们不显式指定聚簇索引,那么MySQL将会按照下面的逻辑来选择聚簇索引:首先会通过主键列来聚集数据 , 如果没有主键列那么会选择唯一的非空索引来替代 。如果还没有这样的索引那么会隐式的创建一个主键列来作为聚簇索引 。
聚簇索引优点:
1、相关数据存放在一起 , 检索的时候降低IO的次数
2、数据访问更快
3、使用覆盖索引扫描的查询可以直接使用节点中的主键值
在使用上面的优点的时候聚簇索引也有一定的缺点:
1、聚簇索引将数据聚集在一起限制了插入速度,插入速度比较依赖于主键的顺序
2、更新索引的时候代价会变高
3、二级索引的访问的时候需要查找两次
非聚簇索引
非聚簇索引通常被称为二级索引,与聚簇索引的不同在于,非聚簇索引的叶子节点存放的是数据的行指针或者是一个主键值 。这样在查找数据的时候首先定位到叶子节点上的主键值(或者行指针),然后通过主键值再到聚簇索引中查找到对应的数据 。从中我们可以看到对于非聚簇索引的查询需要走两次索引 。下图是一个非聚簇索引:
这个索引是InnoDB中的耳机索引 , 叶子节点中存储的是索引和主键 。对于MyISAM叶子节点存储的是索引和行指针 。
覆盖索引
如果一个索引包含或者说覆盖所有需要查询的字段的值 , 那么就称为覆盖索引 。覆盖索引可以极大的提高查询的效率 , 如果我们的查询中只查询索引,而不用去回表那应该最好不过了 。
通常我们使用explain关键字来查看一个查询语句的执行计划,通过执行计划我们可以了解到查询的细节 。如果是覆盖索引,我们会看到执行计划的Extra列里有”Using Index”的信息 。在查询语句中一般我们希望是where条件中的语句尽量能被覆盖,并且顺序要跟索引的保持一致 。还有一个需要注意的点是MySQL不能在索引中使用like操作,这样会导致后面的索引失效 。

