From b472215f0e532cf338076dc7ce56dd00dd7913be Mon Sep 17 00:00:00 2001 From: krahets Date: Mon, 17 Apr 2023 21:00:20 +0800 Subject: [PATCH] build --- chapter_heap/build_heap.md | 8 +- chapter_tree/array_representation_of_tree.md | 132 +++++++++++++++++++ chapter_tree/avl_tree.md | 10 +- chapter_tree/binary_search_tree.md | 8 +- chapter_tree/binary_tree.md | 109 --------------- chapter_tree/summary.md | 2 +- 6 files changed, 145 insertions(+), 124 deletions(-) create mode 100644 chapter_tree/array_representation_of_tree.md diff --git a/chapter_heap/build_heap.md b/chapter_heap/build_heap.md index 7abe4b90b..5e634a142 100644 --- a/chapter_heap/build_heap.md +++ b/chapter_heap/build_heap.md @@ -6,15 +6,13 @@ comments: true 如果我们想要根据输入列表生成一个堆,这个过程被称为「建堆」。 -## 9.2.1.   两种建堆方法 - -### 借助入堆方法实现 +## 9.2.1.   借助入堆方法实现 最直接的方法是借助“元素入堆操作”实现,首先创建一个空堆,然后将列表元素依次添加到堆中。 设元素数量为 $n$ ,则最后一个元素入堆的时间复杂度为 $O(\log n)$ 。在依次添加元素时,堆的平均长度为 $\frac{n}{2}$ ,因此该方法的总体时间复杂度为 $O(n \log n)$ 。 -### 基于堆化操作实现 +## 9.2.2.   基于堆化操作实现 有趣的是,存在一种更高效的建堆方法,其时间复杂度仅为 $O(n)$ 。我们先将列表所有元素原封不动添加到堆中,**然后迭代地对各个节点执行“从顶至底堆化”**。当然,**我们不需要对叶节点执行堆化操作**,因为它们没有子节点。 @@ -155,7 +153,7 @@ comments: true } ``` -## 9.2.2.   复杂度分析 +## 9.2.3.   复杂度分析 为什么第二种建堆方法的时间复杂度是 $O(n)$ ?我们来展开推算一下。 diff --git a/chapter_tree/array_representation_of_tree.md b/chapter_tree/array_representation_of_tree.md new file mode 100644 index 000000000..8da83b59b --- /dev/null +++ b/chapter_tree/array_representation_of_tree.md @@ -0,0 +1,132 @@ +--- +comments: true +--- + +# 8.3.   二叉树数组表示 + +在链表表示下,二叉树的存储单元为节点 `TreeNode` ,节点之间通过指针相连接。在上节中,我们学习了在链表表示下的二叉树的各项基本操作。 + +那么,能否用「数组」来表示二叉树呢?答案是肯定的。 + +## 8.3.1.   表示完美二叉树 + +先分析一个简单案例,给定一个完美二叉树,我们将节点按照层序遍历的顺序编号(从 $0$ 开始),此时每个节点都对应唯一的索引。 + +根据层序遍历的特性,我们可以推导出父节点索引与子节点索引之间的“映射公式”:**若节点的索引为 $i$ ,则该节点的左子节点索引为 $2i + 1$ ,右子节点索引为 $2i + 2$** 。 + +![完美二叉树的数组表示](binary_tree.assets/array_representation_mapping.png) + +

Fig. 完美二叉树的数组表示

+ +**映射公式的作用相当于链表中的指针**。如果我们将节点按照层序遍历的顺序存储在一个数组中,那么对于数组中的任意节点,我们都可以通过映射公式来访问其子节点。 + +## 8.3.2.   表示任意二叉树 + +然而,完美二叉树只是一个特例。在二叉树的中间层,通常存在许多 $\text{null}$ ,而层序遍历序列并不包含这些 $\text{null}$ 。我们无法仅凭该序列来推测 $\text{null}$ 的数量和分布位置,**这意味着存在多种二叉树结构都符合该层序遍历序列**。显然在这种情况下,上述的数组表示方法已经失效。 + +![层序遍历序列对应多种二叉树可能性](binary_tree.assets/array_representation_without_empty.png) + +

Fig. 层序遍历序列对应多种二叉树可能性

+ +为了解决此问题,**我们可以考虑在层序遍历序列中显式地写出所有 $\text{null}$**。如下图所示,这样处理后,层序遍历序列就可以唯一表示二叉树了。 + +=== "Java" + + ```java title="" + /* 二叉树的数组表示 */ + // 使用 int 的包装类 Integer ,就可以使用 null 来标记空位 + Integer[] tree = { 1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15 }; + ``` + +=== "C++" + + ```cpp title="" + /* 二叉树的数组表示 */ + // 为了符合数据类型为 int ,使用 int 最大值标记空位 + // 该方法的使用前提是没有节点的值 = INT_MAX + vector tree = { 1, 2, 3, 4, INT_MAX, 6, 7, 8, 9, INT_MAX, INT_MAX, 12, INT_MAX, INT_MAX, 15 }; + ``` + +=== "Python" + + ```python title="" + # 二叉树的数组表示 + # 直接使用 None 来表示空位 + tree = [1, 2, 3, 4, None, 6, 7, 8, 9, None, None, 12, None, None, 15] + ``` + +=== "Go" + + ```go title="" + /* 二叉树的数组表示 */ + // 使用 any 类型的切片, 就可以使用 nil 来标记空位 + tree := []any{1, 2, 3, 4, nil, 6, 7, 8, 9, nil, nil, 12, nil, nil, 15} + ``` + +=== "JavaScript" + + ```javascript title="" + /* 二叉树的数组表示 */ + // 直接使用 null 来表示空位 + let tree = [1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15]; + ``` + +=== "TypeScript" + + ```typescript title="" + /* 二叉树的数组表示 */ + // 直接使用 null 来表示空位 + let tree: (number | null)[] = [1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15]; + ``` + +=== "C" + + ```c title="" + + ``` + +=== "C#" + + ```csharp title="" + /* 二叉树的数组表示 */ + // 使用 int? 可空类型 ,就可以使用 null 来标记空位 + int?[] tree = { 1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15 }; + ``` + +=== "Swift" + + ```swift title="" + /* 二叉树的数组表示 */ + // 使用 Int? 可空类型 ,就可以使用 nil 来标记空位 + let tree: [Int?] = [1, 2, 3, 4, nil, 6, 7, 8, 9, nil, nil, 12, nil, nil, 15] + ``` + +=== "Zig" + + ```zig title="" + + ``` + +![任意类型二叉树的数组表示](binary_tree.assets/array_representation_with_empty.png) + +

Fig. 任意类型二叉树的数组表示

+ +## 8.3.3.   优势与局限性 + +二叉树的数组表示存在以下优点: + +- 数组存储在连续的内存空间中,缓存友好,访问与遍历速度较快; +- 不需要存储指针,比较节省空间; +- 允许随机访问节点; + +然而,数组表示也具有一些局限性: + +- 数组存储需要连续内存空间,因此不适合存储数据量过大的树。 +- 增删节点需要通过数组插入与删除操作实现,效率较低; +- 当二叉树中存在大量 $\text{null}$ 时,数组中包含的节点数据比重较低,空间利用率较低。 + +**完全二叉树非常适合使用数组来表示**。回顾完全二叉树的定义,$\text{null}$ 只出现在最底层且靠右的位置,**这意味着所有 $\text{null}$ 一定出现在层序遍历序列的末尾**。因此,在使用数组表示完全二叉树时,可以省略存储所有 $\text{null}$ 。 + +![完全二叉树的数组表示](binary_tree.assets/array_representation_complete_binary_tree.png) + +

Fig. 完全二叉树的数组表示

diff --git a/chapter_tree/avl_tree.md b/chapter_tree/avl_tree.md index d90aa05b7..443c0782a 100644 --- a/chapter_tree/avl_tree.md +++ b/chapter_tree/avl_tree.md @@ -2,7 +2,7 @@ comments: true --- -# 8.4.   AVL 树 * +# 8.5.   AVL 树 * 在二叉搜索树章节中,我们提到了在多次插入和删除操作后,二叉搜索树可能退化为链表。这种情况下,所有操作的时间复杂度将从 $O(\log n)$ 恶化为 $O(n)$。 @@ -20,7 +20,7 @@ comments: true G. M. Adelson-Velsky 和 E. M. Landis 在其 1962 年发表的论文 "An algorithm for the organization of information" 中提出了「AVL 树」。论文中详细描述了一系列操作,确保在持续添加和删除节点后,AVL 树不会退化,从而使得各种操作的时间复杂度保持在 $O(\log n)$ 级别。换句话说,在需要频繁进行增删查改操作的场景中,AVL 树能始终保持高效的数据操作性能,具有很好的应用价值。 -## 8.4.1.   AVL 树常见术语 +## 8.5.1.   AVL 树常见术语 「AVL 树」既是二叉搜索树也是平衡二叉树,同时满足这两类二叉树的所有性质,因此也被称为「平衡二叉搜索树」。 @@ -448,7 +448,7 @@ G. M. Adelson-Velsky 和 E. M. Landis 在其 1962 年发表的论文 "An algorit 设平衡因子为 $f$ ,则一棵 AVL 树的任意节点的平衡因子皆满足 $-1 \le f \le 1$ 。 -## 8.4.2.   AVL 树旋转 +## 8.5.2.   AVL 树旋转 AVL 树的特点在于「旋转 Rotation」操作,它能够在不影响二叉树的中序遍历序列的前提下,使失衡节点重新恢复平衡。换句话说,**旋转操作既能保持树的「二叉搜索树」属性,也能使树重新变为「平衡二叉树」**。 @@ -1186,7 +1186,7 @@ AVL 树的特点在于「旋转 Rotation」操作,它能够在不影响二叉 } ``` -## 8.4.3.   AVL 树常用操作 +## 8.5.3.   AVL 树常用操作 ### 插入节点 @@ -1875,7 +1875,7 @@ AVL 树的特点在于「旋转 Rotation」操作,它能够在不影响二叉 AVL 树的节点查找操作与二叉搜索树一致,在此不再赘述。 -## 8.4.4.   AVL 树典型应用 +## 8.5.4.   AVL 树典型应用 - 组织和存储大型数据,适用于高频查找、低频增删的场景; - 用于构建数据库中的索引系统; diff --git a/chapter_tree/binary_search_tree.md b/chapter_tree/binary_search_tree.md index 606de235f..a1125b7c9 100755 --- a/chapter_tree/binary_search_tree.md +++ b/chapter_tree/binary_search_tree.md @@ -2,7 +2,7 @@ comments: true --- -# 8.3.   二叉搜索树 +# 8.4.   二叉搜索树 「二叉搜索树 Binary Search Tree」满足以下条件: @@ -13,7 +13,7 @@ comments: true

Fig. 二叉搜索树

-## 8.3.1.   二叉搜索树的操作 +## 8.4.1.   二叉搜索树的操作 ### 查找节点 @@ -1076,7 +1076,7 @@ comments: true

Fig. 二叉搜索树的中序遍历序列

-## 8.3.2.   二叉搜索树的效率 +## 8.4.2.   二叉搜索树的效率 给定一组数据,我们考虑使用数组或二叉搜索树存储。 @@ -1100,7 +1100,7 @@ comments: true

Fig. 二叉搜索树的平衡与退化

-## 8.3.3.   二叉搜索树常见应用 +## 8.4.3.   二叉搜索树常见应用 - 用作系统中的多级索引,实现高效的查找、插入、删除操作。 - 作为某些搜索算法的底层数据结构。 diff --git a/chapter_tree/binary_tree.md b/chapter_tree/binary_tree.md index 56665cb71..a9cf15431 100644 --- a/chapter_tree/binary_tree.md +++ b/chapter_tree/binary_tree.md @@ -483,112 +483,3 @@ comments: true | 树的节点总数为 $n$ 时的高度 | $\log_2 (n+1) - 1$ | $n - 1$ | - -## 8.1.5.   二叉树表示方式 * - -我们通常使用二叉树的「链表表示」,即存储单位为节点 `TreeNode` ,节点之间通过指针相连接。本文前述示例代码展示了二叉树在链表表示下的各项基本操作。 - -那么,能否用「数组」来表示二叉树呢?答案是肯定的。先来分析一个简单案例,给定一个「完美二叉树」,将节点按照层序遍历的顺序编号(从 0 开始),那么可以推导得出父节点索引与子节点索引之间的“映射公式”:**若节点的索引为 $i$ ,则该节点的左子节点索引为 $2i + 1$ ,右子节点索引为 $2i + 2$** 。 - -**本质上,映射公式的作用相当于链表中的指针**。对于层序遍历序列中的任意节点,我们都可以使用映射公式来访问其子节点。因此,我们可以将二叉树的层序遍历序列存储到数组中,利用以上映射公式来表示二叉树。 - -![完美二叉树的数组表示](binary_tree.assets/array_representation_mapping.png) - -

Fig. 完美二叉树的数组表示

- -然而,完美二叉树只是一个特例。在二叉树的中间层,通常存在许多 $\text{null}$ ,而层序遍历序列并不包含这些 $\text{null}$ 。我们无法仅凭序列来推测空节点的数量和分布位置,**这意味着理论上存在许多种二叉树都符合该层序遍历序列**。显然,在这种情况下,我们无法使用数组来存储二叉树。 - -![给定数组对应多种二叉树可能性](binary_tree.assets/array_representation_without_empty.png) - -

Fig. 给定数组对应多种二叉树可能性

- -为了解决这个问题,我们可以考虑按照完美二叉树的形式来表示所有二叉树,**并在序列中使用特殊符号来显式地表示 $\text{null}$**。如下图所示,这样处理后,层序遍历序列就可以唯一表示二叉树了。 - -=== "Java" - - ```java title="" - /* 二叉树的数组表示 */ - // 使用 int 的包装类 Integer ,就可以使用 null 来标记空位 - Integer[] tree = { 1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15 }; - ``` - -=== "C++" - - ```cpp title="" - /* 二叉树的数组表示 */ - // 为了符合数据类型为 int ,使用 int 最大值标记空位 - // 该方法的使用前提是没有节点的值 = INT_MAX - vector tree = { 1, 2, 3, 4, INT_MAX, 6, 7, 8, 9, INT_MAX, INT_MAX, 12, INT_MAX, INT_MAX, 15 }; - ``` - -=== "Python" - - ```python title="" - # 二叉树的数组表示 - # 直接使用 None 来表示空位 - tree = [1, 2, 3, 4, None, 6, 7, 8, 9, None, None, 12, None, None, 15] - ``` - -=== "Go" - - ```go title="" - /* 二叉树的数组表示 */ - // 使用 any 类型的切片, 就可以使用 nil 来标记空位 - tree := []any{1, 2, 3, 4, nil, 6, 7, 8, 9, nil, nil, 12, nil, nil, 15} - ``` - -=== "JavaScript" - - ```javascript title="" - /* 二叉树的数组表示 */ - // 直接使用 null 来表示空位 - let tree = [1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15]; - ``` - -=== "TypeScript" - - ```typescript title="" - /* 二叉树的数组表示 */ - // 直接使用 null 来表示空位 - let tree: (number | null)[] = [1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15]; - ``` - -=== "C" - - ```c title="" - - ``` - -=== "C#" - - ```csharp title="" - /* 二叉树的数组表示 */ - // 使用 int? 可空类型 ,就可以使用 null 来标记空位 - int?[] tree = { 1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15 }; - ``` - -=== "Swift" - - ```swift title="" - /* 二叉树的数组表示 */ - // 使用 Int? 可空类型 ,就可以使用 nil 来标记空位 - let tree: [Int?] = [1, 2, 3, 4, nil, 6, 7, 8, 9, nil, nil, 12, nil, nil, 15] - ``` - -=== "Zig" - - ```zig title="" - - ``` - -![任意类型二叉树的数组表示](binary_tree.assets/array_representation_with_empty.png) - -

Fig. 任意类型二叉树的数组表示

- -**完全二叉树非常适合使用数组来表示**。回顾「完全二叉树」的定义,$\text{null}$ 只出现在最底层,并且最底层的节点尽量靠左。这意味着,**所有空节点一定出现在层序遍历序列的末尾**。由于我们事先知道了所有 $\text{null}$ 的位置,因此在使用数组表示完全二叉树时,可以省略存储它们。 - -![完全二叉树的数组表示](binary_tree.assets/array_representation_complete_binary_tree.png) - -

Fig. 完全二叉树的数组表示

- -数组表示具有两个显著优点:首先,它不需要存储指针,从而节省了空间;其次,它允许随机访问节点。然而,当二叉树中存在大量 $\text{null}$ 时,数组中包含的节点数据比重较低,导致有效空间利用率降低。 diff --git a/chapter_tree/summary.md b/chapter_tree/summary.md index a3db98ad4..623d0473b 100644 --- a/chapter_tree/summary.md +++ b/chapter_tree/summary.md @@ -2,7 +2,7 @@ comments: true --- -# 8.5.   小结 +# 8.6.   小结 - 二叉树是一种非线性数据结构,体现“一分为二”的分治逻辑。每个二叉树节点包含一个值以及两个指针,分别指向其左子节点和右子节点。 - 对于二叉树中的某个节点,其左(右)子节点及其以下形成的树被称为该节点的左(右)子树。