剑指Offer(sql)——运用二叉查找树优化索引
首先先介绍一下二叉查找树,二叉查找树的每个节点,最多只有两个子树,通常称为左子树和右子树,且左子树节点的值一定小于父节点的值,右子树节点的值一定大于父节点的值,采用这种二叉树的设计,确实会提高我们索引的效率。时间复杂度(logn)。
且图上这棵二叉树,不仅仅是二叉查找树,同时也是平衡二叉树,也就是左右子树高度的相差不超过1.
从原先遍历整个集合(时间复杂度为n),变为折半查找确实提升了效率,但如果有一种特殊情况,让我们的二叉树在从0开始插入的过程中,形成了线性或者近似线性的二叉树,就会让时间复杂度无限逼近于n,大大降低查找效率。
那么,在这种情况下,我们或许是可以使用自平衡二叉树(红黑树)的旋转方法,令我们的线性二叉树经过旋转,转变为n的时间复杂度,但是我们会忽略影响性能最关键的要素——IO。
比如我们在第一张图里去找6,那么会发生三次IO,分别是,读取硬盘中存储的5到内存,读取硬盘中存储的7到内存,读取硬盘中存储的6到内存。
所以,在线性二叉树的情况下,性能是很低的。而优化一下我们的方法,自然就想到B Tree(B-Tree了),至于B-Tree的讲解,我们留到下一讲。