7.1. 二叉树¶
「二叉树 Binary Tree」是一种非线性数据结构,代表着祖先与后代之间的派生关系,体现着“一分为二”的分治逻辑。与链表类似,二叉树的基本单元是节点,每个节点包含一个「值」和两个「指针」。
/* 二叉树节点类 */
class TreeNode {
val: number;
left: TreeNode | null;
right: TreeNode | null;
constructor(val?: number, left?: TreeNode | null, right?: TreeNode | null) {
this.val = val === undefined ? 0 : val; // 节点值
this.left = left === undefined ? null : left; // 左子节点指针
this.right = right === undefined ? null : right; // 右子节点指针
}
}
节点的两个指针分别指向「左子节点」和「右子节点」,同时该节点被称为这两个子节点的「父节点」。当给定一个二叉树的节点时,我们将该节点的左子节点及其以下节点形成的树称为该节点的「左子树」,同理可得「右子树」。
在二叉树中,除叶节点外,其他所有节点都包含子节点和非空子树。例如,在以下示例中,若将“节点 2”视为父节点,则其左子节点和右子节点分别是“节点 4”和“节点 5”,左子树是“节点 4 及其以下节点形成的树”,右子树是“节点 5 及其以下节点形成的树”。
Fig. 父节点、子节点、子树
7.1.1. 二叉树常见术语¶
二叉树涉及的术语较多,建议尽量理解并记住。
- 「根节点 Root Node」:位于二叉树顶层的节点,没有父节点;
- 「叶节点 Leaf Node」:没有子节点的节点,其两个指针均指向 \(\text{null}\) ;
- 节点的「层 Level」:从顶至底递增,根节点所在层为 1 ;
- 节点的「度 Degree」:节点的子节点的数量。在二叉树中,度的范围是 0, 1, 2 ;
- 「边 Edge」:连接两个节点的线段,即节点指针;
- 二叉树的「高度」:从根节点到最远叶节点所经过的边的数量;
- 节点的「深度 Depth」 :从根节点到该节点所经过的边的数量;
- 节点的「高度 Height」:从最远叶节点到该节点所经过的边的数量;
Fig. 二叉树的常用术语
高度与深度的定义
请注意,我们通常将「高度」和「深度」定义为“走过边的数量”,但有些题目或教材可能会将其定义为“走过节点的数量”。在这种情况下,高度和深度都需要加 1 。
7.1.2. 二叉树基本操作¶
初始化二叉树。与链表类似,首先初始化节点,然后构建引用指向(即指针)。
插入与删除节点。与链表类似,通过修改指针来实现插入与删除节点。
Fig. 在二叉树中插入与删除节点
Note
需要注意的是,插入节点可能会改变二叉树的原有逻辑结构,而删除节点通常意味着删除该节点及其所有子树。因此,在二叉树中,插入与删除操作通常是由一套操作配合完成的,以实现有实际意义的操作。
7.1.3. 常见二叉树类型¶
完美二叉树¶
「完美二叉树 Perfect Binary Tree」除了最底层外,其余所有层的节点都被完全填满。在完美二叉树中,叶节点的度为 \(0\) ,其余所有节点的度都为 \(2\) ;若树高度为 \(h\) ,则节点总数为 \(2^{h+1} - 1\) ,呈现标准的指数级关系,反映了自然界中常见的细胞分裂现象。
Tip
在中文社区中,完美二叉树常被称为「满二叉树」,请注意区分。
Fig. 完美二叉树
完全二叉树¶
「完全二叉树 Complete Binary Tree」只有最底层的节点未被填满,且最底层节点尽量靠左填充。
Fig. 完全二叉树
完满二叉树¶
「完满二叉树 Full Binary Tree」除了叶节点之外,其余所有节点都有两个子节点。
Fig. 完满二叉树
平衡二叉树¶
「平衡二叉树 Balanced Binary Tree」中任意节点的左子树和右子树的高度之差的绝对值不超过 1 。
Fig. 平衡二叉树
7.1.4. 二叉树的退化¶
当二叉树的每层节点都被填满时,达到「完美二叉树」;而当所有节点都偏向一侧时,二叉树退化为「链表」。
- 完美二叉树是理想情况,可以充分发挥二叉树“分治”的优势;
- 链表则是另一个极端,各项操作都变为线性操作,时间复杂度退化至 \(O(n)\) ;
Fig. 二叉树的最佳与最差结构
如下表所示,在最佳和最差结构下,二叉树的叶节点数量、节点总数、高度等达到极大或极小值。
完美二叉树 | 链表 | |
---|---|---|
第 \(i\) 层的节点数量 | \(2^{i-1}\) | \(1\) |
树的高度为 \(h\) 时的叶节点数量 | \(2^h\) | \(1\) |
树的高度为 \(h\) 时的节点总数 | \(2^{h+1} - 1\) | \(h + 1\) |
树的节点总数为 \(n\) 时的高度 | \(\log_2 (n+1) - 1\) | \(n - 1\) |
7.1.5. 二叉树表示方式 *¶
我们通常使用二叉树的「链表表示」,即存储单位为节点 TreeNode
,节点之间通过指针相连接。本文前述示例代码展示了二叉树在链表表示下的各项基本操作。
那么,能否用「数组」来表示二叉树呢?答案是肯定的。先来分析一个简单案例,给定一个「完美二叉树」,将节点按照层序遍历的顺序编号(从 0 开始),那么可以推导得出父节点索引与子节点索引之间的“映射公式”:若节点的索引为 \(i\) ,则该节点的左子节点索引为 \(2i + 1\) ,右子节点索引为 \(2i + 2\) 。
本质上,映射公式的作用相当于链表中的指针。对于层序遍历序列中的任意节点,我们都可以使用映射公式来访问其子节点。因此,我们可以将二叉树的层序遍历序列存储到数组中,利用以上映射公式来表示二叉树。
Fig. 完美二叉树的数组表示
然而,完美二叉树只是一个特例。在二叉树的中间层,通常存在许多 \(\text{null}\) ,而层序遍历序列并不包含这些 \(\text{null}\) 。我们无法仅凭序列来推测空节点的数量和分布位置,这意味着理论上存在许多种二叉树都符合该层序遍历序列。显然,在这种情况下,我们无法使用数组来存储二叉树。
Fig. 给定数组对应多种二叉树可能性
为了解决这个问题,我们可以考虑按照完美二叉树的形式来表示所有二叉树,并在序列中使用特殊符号来显式地表示 \(\text{null}\)。如下图所示,这样处理后,层序遍历序列就可以唯一表示二叉树了。
Fig. 任意类型二叉树的数组表示
完全二叉树非常适合使用数组来表示。回顾「完全二叉树」的定义,\(\text{null}\) 只出现在最底层,并且最底层的节点尽量靠左。这意味着,所有空节点一定出现在层序遍历序列的末尾。由于我们事先知道了所有 \(\text{null}\) 的位置,因此在使用数组表示完全二叉树时,可以省略存储它们。
Fig. 完全二叉树的数组表示
数组表示具有两个显著优点:首先,它不需要存储指针,从而节省了空间;其次,它允许随机访问节点。然而,当二叉树中存在大量 \(\text{null}\) 时,数组中包含的节点数据比重较低,导致有效空间利用率降低。