Kaze
Kaze
Published on 2023-10-20 / 12 Visits
0
0

04深入浅出索引(上)

文章地址

总结:

  1. 索引的作用:提高数据查询效率

  2. 常见索引模型:哈希表、有序数组、搜索树

  3. 哈希表:键 - 值(key - value)。

  4. 哈希思路:把值放在数组里,用一个哈希函数把key换算成一个确定的位置,然后把value放在数组的这个位置

  5. 哈希冲突的处理办法:链表

  6. 哈希表适用场景:只有等值查询的场景

  7. 有序数组:按顺序存储。查询用二分法就可以快速查询,时间复杂度是:O(log(N))

  8. 有序数组查询效率高,更新效率低

  9. 有序数组的适用场景:静态存储引擎。

  10. 二叉搜索树:每个节点的左儿子小于父节点,父节点又小于右儿子

  11. 二叉搜索树:查询时间复杂度O(log(N)),更新时间复杂度O(log(N))

  12. 数据库存储大多不适用二叉树,因为树高过高,会使用N叉树

  13. InnoDB中的索引模型:B+Tree

    https://blog.csdn.net/weixin_35871519/article/details/113303881

    img
  14. 索引类型:主键索引、非主键索引 主键索引的叶子节点存的是整行的数据(聚簇索引),非主键索引的叶子节点内容是主键的值(二级索引)

  15. 主键索引和普通索引的区别:主键索引只要搜索ID这个B+Tree即可拿到数据。普通索引先搜索索引拿到主键值,再到主键索引树搜索一次(回表)

  16. 一个数据页满了,按照B+Tree算法,新增加一个数据页,叫做页分裂,会导致性能下降。空间利用率降低大概50%。当相邻的两个数据页利用率很低的时候会做数据页合并,合并的过程是分裂过程的逆过程。

  17. 从性能和存储空间方面考量,自增主键往往是更合理的选择。

思考题:

通过两个 alter 语句重建普通索引 k,以及通过两个 alter 语句重建主键索引是否合理?

重建索引 k 的做法是合理的,可以达到省空间的目的。

索引可能因为删除,或者页分裂等原因,导致数据页有空洞,重建索引的过程会创建一个新的索引,把数据按顺序插入,这样页面的利用率最高,也就是索引更紧凑、更省空间。

但是,重建主键的过程不合理。不论是删除主键还是创建主键,都会将整个表重建。所以连着执行这两个语句的话,第一个语句就白做了。这两个语句,你可以用这个语句代替 : alter table T engine=InnoDB。

1、删除主键会导致所有二级索引失效,危险操作

2、删除主键后,会用RAWID作为主键,重建二级索引。如果这时候再创建主键,又会让二级索引失效,失效后再次触发二级索引重建


Comment