|
|
|
@ -1,18 +1,17 @@
|
|
|
|
|
# AVL 树
|
|
|
|
|
|
|
|
|
|
## AVL 树的起源
|
|
|
|
|
## AVL 树起源
|
|
|
|
|
|
|
|
|
|
在「二叉搜索树」章节中提到,如进行多次插入与删除操作后,二叉搜索树可能会退化为链表。此时所有操作的时间复杂度都会由 $O(\log n)$ 劣化至 $O(n)$ 。例如,删除结点 4 后,该二叉搜索树就会退化为链表。
|
|
|
|
|
在「二叉搜索树」章节中提到,在进行多次插入与删除操作后,二叉搜索树可能会退化为链表。此时所有操作的时间复杂度都会由 $O(\log n)$ 劣化至 $O(n)$ 。如下图所示,执行两步删除结点后,该二叉搜索树就会退化为链表。
|
|
|
|
|
|
|
|
|
|
=== "删除前"
|
|
|
|
|
![binary search tree1](avl_tree.assets/binary_search_tree1.png)
|
|
|
|
|
=== "删除后"
|
|
|
|
|
![binary search tree2](avl_tree.assets/binary_search_tree2.png)
|
|
|
|
|
|
|
|
|
|
为了解决这一问题,G. M. Adelson-Velsky 和 E. M. Landis 在其 1962 年发表的论文 "An algorithm for the organization of info
|
|
|
|
|
rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,常被称为「AVL 树」。
|
|
|
|
|
为了解决这一问题,G. M. Adelson-Velsky 和 E. M. Landis 在其 1962 年发表的论文 "An algorithm for the organization of information" 中提出了「平衡二叉搜索树」,并以两位作者命名,常被称为「AVL 树」。
|
|
|
|
|
|
|
|
|
|
## AVL 树的性质
|
|
|
|
|
## AVL 树性质
|
|
|
|
|
|
|
|
|
|
「AVL 树」既是「二叉搜索树」又是「平衡二叉树」,同时满足这两种二叉树的所有性质。「平衡二叉树」规定树中任意结点左右子树的高度差的绝对值不能超过 1 。本文定义:
|
|
|
|
|
|
|
|
|
@ -23,11 +22,11 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
|
|
|
|
|
|
|
|
|
|
设「平衡因子」为 $f$ ,则一棵 AVL 树的任意结点的平衡因子满足 $-1 \le f \le 1$
|
|
|
|
|
|
|
|
|
|
## AVL 树的优势
|
|
|
|
|
## AVL 树优势
|
|
|
|
|
|
|
|
|
|
提出 AVL 树的两位大佬的厉害之处在于,他们设计了一系列操作,使得 AVL 树在不断添加与删除结点后,仍然不会发生退化,进而使得各种操作的时间复杂度均能保持在 $O(\log n)$ 级别。
|
|
|
|
|
提出 AVL 树的两位大佬的厉害之处在于,**他们设计了一系列操作,使得 AVL 树在不断添加与删除结点后,仍然不会发生退化**,进而使得各种操作的时间复杂度均能保持在 $O(\log n)$ 级别。
|
|
|
|
|
|
|
|
|
|
## AVL 树的操作
|
|
|
|
|
## AVL 树操作
|
|
|
|
|
|
|
|
|
|
### 查找结点
|
|
|
|
|
|
|
|
|
@ -35,17 +34,17 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
|
|
|
|
|
|
|
|
|
|
### 插入结点
|
|
|
|
|
|
|
|
|
|
由于平衡二叉树需要保证其任意结点的平衡因子满足限制,所以在插入结点后可能会造成 AVL 树的失衡。例如,平衡二叉树在插入结点 0 前 / 后如下图所示(括号内表示当前结点的平衡因子):
|
|
|
|
|
**插入结点可能会造成平衡二叉树失衡。** 例如下图(括号内数值为结点的平衡因子),插入后结点 2 和 结点 3 已经不满足平衡二叉树的性质,我们将这一现象称为「失衡」。
|
|
|
|
|
|
|
|
|
|
=== "插入前"
|
|
|
|
|
![avl tree 1](avl_tree.assets/avl_tree1.png)
|
|
|
|
|
=== "插入后"
|
|
|
|
|
![avl tree 2](avl_tree.assets/avl_tree2.png)
|
|
|
|
|
|
|
|
|
|
观察发现,插入后结点 2 和 结点 3 已经不满足平衡二叉树的性质,我们将这一现象称为 **失衡** 。为了解决该问题,首先需要分析哪些结点会出现失衡,经过观察可得两条规律:
|
|
|
|
|
为了解决失衡问题,首先需要 **分析哪些结点会出现失衡**,经过观察可得两条规律:
|
|
|
|
|
|
|
|
|
|
- 出现失衡的结点都必然出现在新插入结点与根结点的路径上;
|
|
|
|
|
- 在这条路径上,该插入结点的父结点一定不会失衡,即首先失衡的结点必然是父节点之上的结点;
|
|
|
|
|
- 在此路径上,出现失衡的结点必然是新插入结点的父结点之上的结点;
|
|
|
|
|
|
|
|
|
|
!!! tip "证明"
|
|
|
|
|
|
|
|
|
@ -56,19 +55,22 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
|
|
|
|
|
|
|
|
|
|
因此父结点一定不会失衡,证毕。
|
|
|
|
|
|
|
|
|
|
现在考虑如何将一个失衡点恢复为平衡点。
|
|
|
|
|
**接下来考虑如何将一个失衡点恢复为平衡点。** 我们知道二叉搜索树的中序遍历序列一定是严格升序的,而在论文中,作者定义了一种「旋转 Rotation」的操作,其可 **在不影响二叉树中序遍历序列的情况下,降低失衡点左右子树的高度差** 。
|
|
|
|
|
|
|
|
|
|
我们知道对于二叉搜索树的中序遍历序列一定是严格升序的。在论文中,作者定义了一种被称为「旋转 Rotation」的操作,其可 **在不影响二叉树中序遍历序列的情况下,降低失衡点左右子树的高度差** 。
|
|
|
|
|
!!! note
|
|
|
|
|
换言之,「旋转」操作可以保持树为「二叉搜索树」,并且可让树逐渐变为平衡二叉树。
|
|
|
|
|
|
|
|
|
|
#### 右旋
|
|
|
|
|
|
|
|
|
|
以上文中提到的发生失衡的 AVL 树为例,「右旋」的具体操作为:
|
|
|
|
|
以上文中提到的发生失衡的 AVL 树为例,首个失衡点是 **结点 2** 。将该结点记为 `node` ,其左子节点记为 `node.left` ,「右旋」就好像将这两个结点进行 “顺时针旋转” ,操作流程为:
|
|
|
|
|
|
|
|
|
|
1. 首先可以找到第一个发生失衡的点是结点 2 。
|
|
|
|
|
2. 以该点为轴顺时针旋转,使该点左孩子的右子树指向该点,该点的左子树指向其左孩子的右子树。
|
|
|
|
|
3. 将原本的左孩子连接至该点的父结点。
|
|
|
|
|
1. 令 `node.left` 的右指针指向 `node` ;
|
|
|
|
|
2. 令 `node` 的左指针指向 `node.left` 的右子树。
|
|
|
|
|
3. 令 `node` 的父结点指向 `node.left` ,替代原来 `node` 的位置。
|
|
|
|
|
|
|
|
|
|
观察得知,经过右旋后,整棵二叉树已经恢复平衡,并且中序遍历序列也保持不变。
|
|
|
|
|
以上流程比较晦涩难记,实际上,右旋就像是把 `node.left` “拎起来” 顺时针旋转了一下,可以使用这个动画辅助理解。
|
|
|
|
|
|
|
|
|
|
观察得知,经过右旋后,整棵二叉树已经恢复平衡,并且仍然为二叉搜索树。
|
|
|
|
|
|
|
|
|
|
=== "Step 1"
|
|
|
|
|
![avl tree3](avl_tree.assets/avl_tree2.png)
|
|
|
|
@ -79,13 +81,13 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
|
|
|
|
|
|
|
|
|
|
#### 左旋
|
|
|
|
|
|
|
|
|
|
下面来看与之对应的「左旋」,需要使用左旋的情况与右旋相似,下面以例子来说明左旋的过程:
|
|
|
|
|
类似地,下图中首个失衡点是 **结点 3** ,将失衡结点记为 `node` ,其右子节点记为 `node.right` ,「左旋」就好像将这两个结点进行 “逆时针旋转” ,操作流程为:
|
|
|
|
|
|
|
|
|
|
1. 首先可以找到第一个发生失衡的点是结点 3 。
|
|
|
|
|
2. 以该点为轴逆时针旋转,使该点右孩子的左子树指向该点,该点的右子树指向其右孩子的左子树。
|
|
|
|
|
3. 将原本的右孩子连接至该点的父结点。
|
|
|
|
|
1. 令 `node.right` 的左指针指向 `node` ;
|
|
|
|
|
2. 令 `node` 的右指针指向 `node.right` 的左子树。
|
|
|
|
|
3. 令 `node` 的父结点指向 `node.right` ,替代原来 `node` 的位置。
|
|
|
|
|
|
|
|
|
|
与右旋相同,左旋也可以让失衡的结点恢复平衡,同时不会改变中序遍历序列。
|
|
|
|
|
观察发现,**「左旋」和「右旋」操作是镜像对称的**,因此我们只需记住一个操作即可,另一个可以直接推导出来。
|
|
|
|
|
|
|
|
|
|
=== "Step 1"
|
|
|
|
|
![rotate left1](avl_tree.assets/rotate_left1.png)
|
|
|
|
@ -96,20 +98,12 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
|
|
|
|
|
|
|
|
|
|
#### 双旋
|
|
|
|
|
|
|
|
|
|
「双旋」分为两种,一种是「先左旋后右旋」,另一种是「先右旋后左旋」。
|
|
|
|
|
|
|
|
|
|
以先左后右为例,如果直接对下图二叉树的失衡点执行右旋,会发现并不能使失衡点恢复平衡。
|
|
|
|
|
「双旋」是左旋和右旋的组合,一种是「先左旋后右旋」,另一种是「先右旋后左旋」。
|
|
|
|
|
|
|
|
|
|
=== "Step 1"
|
|
|
|
|
![rotate left right1](avl_tree.assets/rotate_left_right1.png)
|
|
|
|
|
=== "Step 2"
|
|
|
|
|
![rotate left right2](avl_tree.assets/rotate_left_right2.png)
|
|
|
|
|
比如对于下图的失衡结点 3 ,单一使用左旋或右旋无法使该结点恢复平衡,需要「先左旋后右旋」。设结点 3 为 `node` ,其左子结点为 `node.left` ,则分为两步:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
为了解决该问题,需要「先左旋后右旋」,即分为两步:
|
|
|
|
|
|
|
|
|
|
1. 将失衡点的左孩子执行左旋。
|
|
|
|
|
2. 对失衡点执行右旋。
|
|
|
|
|
1. 对 `node.left` 执行「左旋」。
|
|
|
|
|
2. 对 `node` 执行「右旋」。
|
|
|
|
|
|
|
|
|
|
=== "Step 1"
|
|
|
|
|
![rotate left right3](avl_tree.assets/rotate_left_right1.png)
|
|
|
|
@ -118,7 +112,9 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
|
|
|
|
|
=== "Step 3"
|
|
|
|
|
![rotate left right5](avl_tree.assets/rotate_left_right4.png)
|
|
|
|
|
|
|
|
|
|
同理,「先左旋后右旋」是先将失衡点的左孩子执行右旋,然后对失衡点执行左旋。
|
|
|
|
|
同理,「先右旋后左旋」是先对 `node.right` 执行右旋,然后对 `node` 执行左旋。
|
|
|
|
|
|
|
|
|
|
(图)
|
|
|
|
|
|
|
|
|
|
#### 旋转选择
|
|
|
|
|
|
|
|
|
|