剑指Offer(sql)——运用二叉查找树优化索引

剑指Offer(sql)——运用二叉查找树优化索引

首先先介绍一下二叉查找树,二叉查找树的每个节点,最多只有两个子树,通常称为左子树和右子树,且左子树节点的值一定小于父节点的值,右子树节点的值一定大于父节点的值,采用这种二叉树的设计,确实会提高我们索引的效率。时间复杂度(logn)。

且图上这棵二叉树,不仅仅是二叉查找树,同时也是平衡二叉树,也就是左右子树高度的相差不超过1.

从原先遍历整个集合(时间复杂度为n),变为折半查找确实提升了效率,但如果有一种特殊情况,让我们的二叉树在从0开始插入的过程中,形成了线性或者近似线性的二叉树,就会让时间复杂度无限逼近于n,大大降低查找效率。

剑指Offer(sql)——运用二叉查找树优化索引
那么,在这种情况下,我们或许是可以使用自平衡二叉树(红黑树)的旋转方法,令我们的线性二叉树经过旋转,转变为n的时间复杂度,但是我们会忽略影响性能最关键的要素——IO。

比如我们在第一张图里去找6,那么会发生三次IO,分别是,读取硬盘中存储的5到内存,读取硬盘中存储的7到内存,读取硬盘中存储的6到内存。

所以,在线性二叉树的情况下,性能是很低的。而优化一下我们的方法,自然就想到B Tree(B-Tree了),至于B-Tree的讲解,我们留到下一讲。