Refactor the articles related to searching algorithm. Add the chapter of binary search. Add the section of searching algorithm revisited. (#464)

pull/468/head
Yudong Jin 2 years ago committed by GitHub
parent 28fdd26f2f
commit 881d573790
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

@ -8,8 +8,7 @@ include_directories(./include)
add_subdirectory(include)
add_subdirectory(chapter_computational_complexity)
add_subdirectory(chapter_array_and_linkedlist)
add_subdirectory(chapter_sorting)
add_subdirectory(chapter_tree)
add_subdirectory(chapter_stack_and_queue)
add_subdirectory(chapter_binary_search)
add_subdirectory(chapter_heap)
add_subdirectory(chapter_searching)

@ -0,0 +1 @@
add_executable(linear_search linear_search.c)

@ -1,4 +1,3 @@
add_executable(time_complexity time_complexity.c)
add_executable(worst_best_time_complexity worst_best_time_complexity.c)
add_executable(leetcode_two_sum leetcode_two_sum.c)
add_executable(space_complexity space_complexity.c)

@ -1,3 +1,2 @@
add_executable(binary_search binary_search.c)
add_executable(linear_search linear_search.c)
add_executable(hashing_search hashing_search.c)
add_executable(leetcode_two_sum leetcode_two_sum.c)

@ -8,6 +8,7 @@ include_directories(./include)
add_subdirectory(chapter_computational_complexity)
add_subdirectory(chapter_array_and_linkedlist)
add_subdirectory(chapter_stack_and_queue)
add_subdirectory(chapter_binary_search)
add_subdirectory(chapter_hashing)
add_subdirectory(chapter_tree)
add_subdirectory(chapter_heap)

@ -0,0 +1 @@
add_executable(binary_search binary_search.cpp)

@ -1,4 +1,3 @@
add_executable(leetcode_two_sum leetcode_two_sum.cpp)
add_executable(space_complexity space_complexity.cpp)
add_executable(time_complexity time_complexity.cpp)
add_executable(worst_best_time_complexity worst_best_time_complexity.cpp)

@ -1,3 +1,3 @@
add_executable(binary_search binary_search.cpp)
add_executable(hashing_search hashing_search.cpp)
add_executable(leetcode_two_sum leetcode_two_sum.cpp)
add_executable(linear_search linear_search.cpp)

@ -6,7 +6,7 @@
using NUnit.Framework;
namespace hello_algo.chapter_searching;
namespace hello_algo.chapter_binary_search;
public class binary_search
{

@ -6,7 +6,7 @@
using NUnit.Framework;
namespace hello_algo.chapter_computational_complexity;
namespace hello_algo.chapter_searching;
public class leetcode_two_sum
{

@ -2,7 +2,7 @@
// Created Time: 2022-12-05
// Author: Slone123c (274325721@qq.com)
package chapter_searching
package chapter_binary_search
/* 二分查找(双闭区间) */
func binarySearch(nums []int, target int) int {

@ -2,7 +2,7 @@
// Created Time: 2022-12-05
// Author: Slone123c (274325721@qq.com)
package chapter_searching
package chapter_binary_search
import (
"fmt"

@ -2,7 +2,7 @@
// Created Time: 2022-11-25
// Author: reanon (793584285@qq.com)
package chapter_computational_complexity
package chapter_searching
/* 方法一:暴力枚举 */
func twoSumBruteForce(nums []int, target int) []int {

@ -2,7 +2,7 @@
// Created Time: 2022-11-25
// Author: reanon (793584285@qq.com)
package chapter_computational_complexity
package chapter_searching
import (
"fmt"

@ -4,6 +4,8 @@
* Author: Krahets (krahets@163.com)
*/
package chapter_backtracking;
import include.*;
import java.util.*;

@ -4,6 +4,8 @@
* Author: Krahets (krahets@163.com)
*/
package chapter_backtracking;
import include.*;
import java.util.*;

@ -4,6 +4,8 @@
* Author: Krahets (krahets@163.com)
*/
package chapter_backtracking;
import include.*;
import java.util.*;

@ -4,6 +4,8 @@
* Author: Krahets (krahets@163.com)
*/
package chapter_backtracking;
import include.*;
import java.util.*;

@ -4,7 +4,7 @@
* Author: Krahets (krahets@163.com)
*/
package chapter_searching;
package chapter_binary_search;
public class binary_search {
/* 二分查找(双闭区间) */

@ -4,7 +4,7 @@
* Author: Krahets (krahets@163.com)
*/
package chapter_computational_complexity;
package chapter_searching;
import java.util.*;

@ -62,4 +62,3 @@ pub fn main() !void {
_ = try std.io.getStdIn().reader().readByte();
}

@ -2,8 +2,6 @@
「二分查找 Binary Search」利用数据的有序性通过每轮减少一半搜索范围来定位目标元素。
## 算法实现
给定一个长度为 $n$ 的有序数组 `nums` ,元素按从小到大的顺序排列。数组索引的取值范围为:
$$
@ -12,10 +10,10 @@ $$
我们通常使用以下两种方法来表示这个取值范围:
1. **双闭区间 $[0, n-1]$** ,即两个边界都包含自身;在此方法下,区间 $[0, 0]$ 仍包含 $1$ 个元素;
2. **左闭右开 $[0, n)$** ,即左边界包含自身、右边界不包含自身;在此方法下,区间 $[0, 0)$ 不包含元素;
1. **双闭区间 $[0, n-1]$** ,即两个边界都包含自身;在此方法下,区间 $[i, i]$ 仍包含 $1$ 个元素;
2. **左闭右开 $[0, n)$** ,即左边界包含自身、右边界不包含自身;在此方法下,区间 $[i, i)$ 不包含元素;
### 双闭区间实现
## 双闭区间实现
首先,我们采用“双闭区间”表示法,在数组 `nums` 中查找目标元素 `target` 的对应索引。
@ -102,88 +100,7 @@ $$
[class]{}-[func]{binarySearch}
```
### “左闭右开”实现
此外,我们也可以采用“左闭右开”的表示法,编写具有相同功能的二分查找代码。
=== "Java"
```java title="binary_search.java"
[class]{binary_search}-[func]{binarySearch1}
```
=== "C++"
```cpp title="binary_search.cpp"
[class]{}-[func]{binarySearch1}
```
=== "Python"
```python title="binary_search.py"
[class]{}-[func]{binary_search1}
```
=== "Go"
```go title="binary_search.go"
[class]{}-[func]{binarySearch1}
```
=== "JavaScript"
```javascript title="binary_search.js"
[class]{}-[func]{binarySearch1}
```
=== "TypeScript"
```typescript title="binary_search.ts"
[class]{}-[func]{binarySearch1}
```
=== "C"
```c title="binary_search.c"
[class]{}-[func]{binarySearch1}
```
=== "C#"
```csharp title="binary_search.cs"
[class]{binary_search}-[func]{binarySearch1}
```
=== "Swift"
```swift title="binary_search.swift"
[class]{}-[func]{binarySearch1}
```
=== "Zig"
```zig title="binary_search.zig"
[class]{}-[func]{binarySearch1}
```
### 两种表示对比
对比这两种代码写法,我们可以发现以下不同点:
<div class="center-table" markdown>
| 表示方法 | 初始化指针 | 缩小区间 | 循环终止条件 |
| ------------------- | ------------------- | ------------------------- | ------------ |
| 双闭区间 $[0, n-1]$ | $i = 0$ , $j = n-1$ | $i = m + 1$ , $j = m - 1$ | $i > j$ |
| 左闭右开 $[0, n)$ | $i = 0$ , $j = n$ | $i = m + 1$ , $j = m$ | $i = j$ |
</div>
在“双闭区间”表示法中,由于对左右两边界的定义相同,因此缩小区间的 $i$ 和 $j$ 的处理方法也是对称的,这样更不容易出错。因此,**建议采用“双闭区间”的写法**。
### 大数越界处理
当数组长度非常大时,加法 $i + j$ 的结果可能会超出 `int` 类型的取值范围。在这种情况下,我们需要采用一种更安全的计算中点的方法。
需要注意的是,**当数组长度非常大时,加法 $i + j$ 的结果可能会超出 `int` 类型的取值范围**。在这种情况下,我们需要采用一种更安全的计算中点的方法。
=== "Java"
@ -267,6 +184,83 @@ $$
```
## 左闭右开实现
我们可以采用“左闭右开”的表示法,编写具有相同功能的二分查找代码。
=== "Java"
```java title="binary_search.java"
[class]{binary_search}-[func]{binarySearch1}
```
=== "C++"
```cpp title="binary_search.cpp"
[class]{}-[func]{binarySearch1}
```
=== "Python"
```python title="binary_search.py"
[class]{}-[func]{binary_search1}
```
=== "Go"
```go title="binary_search.go"
[class]{}-[func]{binarySearch1}
```
=== "JavaScript"
```javascript title="binary_search.js"
[class]{}-[func]{binarySearch1}
```
=== "TypeScript"
```typescript title="binary_search.ts"
[class]{}-[func]{binarySearch1}
```
=== "C"
```c title="binary_search.c"
[class]{}-[func]{binarySearch1}
```
=== "C#"
```csharp title="binary_search.cs"
[class]{binary_search}-[func]{binarySearch1}
```
=== "Swift"
```swift title="binary_search.swift"
[class]{}-[func]{binarySearch1}
```
=== "Zig"
```zig title="binary_search.zig"
[class]{}-[func]{binarySearch1}
```
对比这两种代码写法,我们可以发现以下不同点:
<div class="center-table" markdown>
| 表示方法 | 初始化指针 | 缩小区间 | 循环终止条件 |
| ------------------- | ------------------- | ------------------------- | ------------ |
| 双闭区间 $[0, n-1]$ | $i = 0$ , $j = n-1$ | $i = m + 1$ , $j = m - 1$ | $i > j$ |
| 左闭右开 $[0, n)$ | $i = 0$ , $j = n$ | $i = m + 1$ , $j = m$ | $i = j$ |
</div>
在“双闭区间”表示法中,由于对左右两边界的定义相同,因此缩小区间的 $i$ 和 $j$ 的处理方法也是对称的,这样更不容易出错。因此,**建议采用“双闭区间”的写法**。
## 复杂度分析
**时间复杂度 $O(\log n)$** :其中 $n$ 为数组长度;每轮排除一半的区间,因此循环轮数为 $\log_2 n$ ,使用 $O(\log n)$ 时间。

@ -961,3 +961,11 @@ $$
例如“归并排序”算法,输入长度为 $n$ 的数组,每轮递归将数组从中点划分为两半,形成高度为 $\log n$ 的递归树,使用 $O(\log n)$ 栈帧空间。
再例如“数字转化为字符串”,输入任意正整数 $n$ ,它的位数为 $\log_{10} n$ ,即对应字符串长度为 $\log_{10} n$ ,因此空间复杂度为 $O(\log_{10} n) = O(\log n)$ 。
## 权衡时间与空间
理想情况下,我们希望算法的时间复杂度和空间复杂度都能达到最优。然而在实际情况中,同时优化时间复杂度和空间复杂度通常是非常困难的。
**降低时间复杂度通常需要以提升空间复杂度为代价,反之亦然**。我们将牺牲内存空间来提升算法运行速度的思路称为“以空间换时间”;反之,则称为“以时间换空间”。
选择哪种思路取决于我们更看重哪个方面。在大多数情况下,时间比空间更宝贵,因此以空间换时间通常是更常用的策略。当然,在数据量很大的情况下,控制空间复杂度也是非常重要的。

@ -1,12 +1,12 @@
# 小结
### 算法效率评估
**算法效率评估**
- 时间效率和空间效率是评价算法性能的两个关键维度。
- 我们可以通过实际测试来评估算法效率,但难以消除测试环境的影响,且会耗费大量计算资源。
- 复杂度分析可以克服实际测试的弊端,分析结果适用于所有运行平台,并且能够揭示算法在不同数据规模下的效率。
### 时间复杂度
**时间复杂度**
- 时间复杂度用于衡量算法运行时间随数据量增长的趋势,可以有效评估算法效率,但在某些情况下可能失效,如在输入数据量较小或时间复杂度相同时,无法精确对比算法效率的优劣。
- 最差时间复杂度使用大 $O$ 符号表示,即函数渐近上界,反映当 $n$ 趋向正无穷时,$T(n)$ 的增长级别。
@ -15,7 +15,7 @@
- 某些算法的时间复杂度非固定,而是与输入数据的分布有关。时间复杂度分为最差、最佳、平均时间复杂度,最佳时间复杂度几乎不用,因为输入数据一般需要满足严格条件才能达到最佳情况。
- 平均时间复杂度反映算法在随机数据输入下的运行效率,最接近实际应用中的算法性能。计算平均时间复杂度需要统计输入数据分布以及综合后的数学期望。
### 空间复杂度
**空间复杂度**
- 类似于时间复杂度,空间复杂度用于衡量算法占用空间随数据量增长的趋势。
- 算法运行过程中的相关内存空间可分为输入空间、暂存空间、输出空间。通常情况下,输入空间不计入空间复杂度计算。暂存空间可分为指令空间、数据空间、栈帧空间,其中栈帧空间通常仅在递归函数中影响空间复杂度。

@ -6,24 +6,17 @@
![哈希表的抽象表示](hash_map.assets/hash_map.png)
## 哈希表效率
除哈希表外,我们还可以使用数组或链表实现查询功能,各项操作的时间复杂度如下表所示。
除哈希表外,还可以使用以下数据结构来实现上述查询功能:
1. **无序数组**:每个元素为 `[学号, 姓名]`
2. **有序数组**:将 `1.` 中的数组按照学号从小到大排序;
3. **链表**:每个节点的值为 `[学号, 姓名]`
4. **二叉搜索树**:每个节点的值为 `[学号, 姓名]` ,根据学号大小来构建树;
各项操作的时间复杂度如下表所示(详解可见[二叉搜索树章节](https://www.hello-algo.com/chapter_tree/binary_search_tree/))。无论是查找元素还是增删元素,哈希表的时间复杂度都是 $O(1)$ ,全面胜出!
在哈希表中增删查改的时间复杂度都是 $O(1)$ ,全面胜出!因此,哈希表常用于对查找效率要求较高的场景。
<div class="center-table" markdown>
| | 无序数组 | 有序数组 | 链表 | 二叉搜索树 | 哈希表 |
| -------- | -------- | ----------- | ------ | ----------- | ------ |
| 查找元素 | $O(n)$ | $O(\log n)$ | $O(n)$ | $O(\log n)$ | $O(1)$ |
| 插入元素 | $O(1)$ | $O(n)$ | $O(1)$ | $O(\log n)$ | $O(1)$ |
| 删除元素 | $O(n)$ | $O(n)$ | $O(n)$ | $O(\log n)$ | $O(1)$ |
| | 数组 | 链表 | 哈希表 |
| -------- | ------ | ------ | ------ |
| 查找元素 | $O(n)$ | $O(n)$ | $O(1)$ |
| 插入元素 | $O(1)$ | $O(1)$ | $O(1)$ |
| 删除元素 | $O(n)$ | $O(n)$ | $O(1)$ |
</div>

Binary file not shown.

Before

Width:  |  Height:  |  Size: 68 KiB

@ -1,152 +0,0 @@
# 哈希查找
「哈希查找 Hash Searching」通过使用哈希表来存储所需的键值对从而可在 $O(1)$ 时间内完成“键 $\rightarrow$ 值”的查找操作。
与线性查找相比,哈希查找通过利用额外空间来提高效率,体现了“以空间换时间”的算法思想。
## 算法实现
例如,若我们想要在给定数组中找到目标元素 `target` 的索引,则可以使用哈希查找来实现。
![哈希查找数组索引](hashing_search.assets/hash_search_index.png)
=== "Java"
```java title="hashing_search.java"
[class]{hashing_search}-[func]{hashingSearchArray}
```
=== "C++"
```cpp title="hashing_search.cpp"
[class]{}-[func]{hashingSearchArray}
```
=== "Python"
```python title="hashing_search.py"
[class]{}-[func]{hashing_search_array}
```
=== "Go"
```go title="hashing_search.go"
[class]{}-[func]{hashingSearchArray}
```
=== "JavaScript"
```javascript title="hashing_search.js"
[class]{}-[func]{hashingSearchArray}
```
=== "TypeScript"
```typescript title="hashing_search.ts"
[class]{}-[func]{hashingSearchArray}
```
=== "C"
```c title="hashing_search.c"
[class]{}-[func]{hashingSearchArray}
```
=== "C#"
```csharp title="hashing_search.cs"
[class]{hashing_search}-[func]{hashingSearchArray}
```
=== "Swift"
```swift title="hashing_search.swift"
[class]{}-[func]{hashingSearchArray}
```
=== "Zig"
```zig title="hashing_search.zig"
[class]{}-[func]{hashingSearchArray}
```
同样,若要根据目标节点值 target 查找对应的链表节点对象,也可以采用哈希查找方法。
![哈希查找链表节点](hashing_search.assets/hash_search_listnode.png)
=== "Java"
```java title="hashing_search.java"
[class]{hashing_search}-[func]{hashingSearchLinkedList}
```
=== "C++"
```cpp title="hashing_search.cpp"
[class]{}-[func]{hashingSearchLinkedList}
```
=== "Python"
```python title="hashing_search.py"
[class]{}-[func]{hashing_search_linkedlist}
```
=== "Go"
```go title="hashing_search.go"
[class]{}-[func]{hashingSearchLinkedList}
```
=== "JavaScript"
```javascript title="hashing_search.js"
[class]{}-[func]{hashingSearchLinkedList}
```
=== "TypeScript"
```typescript title="hashing_search.ts"
[class]{}-[func]{hashingSearchLinkedList}
```
=== "C"
```c title="hashing_search.c"
[class]{}-[func]{hashingSearchLinkedList}
```
=== "C#"
```csharp title="hashing_search.cs"
[class]{hashing_search}-[func]{hashingSearchLinkedList}
```
=== "Swift"
```swift title="hashing_search.swift"
[class]{}-[func]{hashingSearchLinkedList}
```
=== "Zig"
```zig title="hashing_search.zig"
[class]{}-[func]{hashingSearchLinkedList}
```
## 复杂度分析
**时间复杂度 $O(1)$** :哈希表的查找操作使用 $O(1)$ 时间。
**空间复杂度 $O(n)$** :其中 $n$ 是数组或链表的长度。
## 优点与局限性
哈希查找的性能表现相当优秀,查找、插入、删除操作的平均时间复杂度均为 $O(1)$ 。尽管如此,哈希查找仍然存在一些问题:
- 辅助哈希表需要占用 $O(n)$ 的额外空间,意味着需要预留更多的计算机内存;
- 构建和维护哈希表需要时间,因此哈希查找不适用于高频增删、低频查找的场景;
- 当哈希冲突严重时,哈希表可能退化为链表,导致时间复杂度劣化至 $O(n)$
- 当数据量较小时,线性查找可能比哈希查找更快。这是因为计算哈希函数可能比遍历一个小型数组更慢;
因此,在实际应用中,我们需要根据具体情况灵活选择解决方案。

@ -1,143 +0,0 @@
# 线性查找
「线性查找 Linear Search」是一种简单的查找方法其从数据结构的一端开始逐个访问每个元素直至另一端为止。
## 算法实现
例如,若我们想要在数组 `nums` 中查找目标元素 `target` 的对应索引,可以采用线性查找方法。
![在数组中线性查找元素](linear_search.assets/linear_search.png)
=== "Java"
```java title="linear_search.java"
[class]{linear_search}-[func]{linearSearchArray}
```
=== "C++"
```cpp title="linear_search.cpp"
[class]{}-[func]{linearSearchArray}
```
=== "Python"
```python title="linear_search.py"
[class]{}-[func]{linear_search_array}
```
=== "Go"
```go title="linear_search.go"
[class]{}-[func]{linearSearchArray}
```
=== "JavaScript"
```javascript title="linear_search.js"
[class]{}-[func]{linearSearchArray}
```
=== "TypeScript"
```typescript title="linear_search.ts"
[class]{}-[func]{linearSearchArray}
```
=== "C"
```c title="linear_search.c"
[class]{}-[func]{linearSearchArray}
```
=== "C#"
```csharp title="linear_search.cs"
[class]{linear_search}-[func]{linearSearchArray}
```
=== "Swift"
```swift title="linear_search.swift"
[class]{}-[func]{linearSearchArray}
```
=== "Zig"
```zig title="linear_search.zig"
[class]{}-[func]{linearSearchArray}
```
另一个例子,若需要在链表中查找给定目标节点值 `target` 并返回该节点对象,同样可以使用线性查找。
=== "Java"
```java title="linear_search.java"
[class]{linear_search}-[func]{linearSearchLinkedList}
```
=== "C++"
```cpp title="linear_search.cpp"
[class]{}-[func]{linearSearchLinkedList}
```
=== "Python"
```python title="linear_search.py"
[class]{}-[func]{linear_search_linkedlist}
```
=== "Go"
```go title="linear_search.go"
[class]{}-[func]{linearSearchLinkedList}
```
=== "JavaScript"
```javascript title="linear_search.js"
[class]{}-[func]{linearSearchLinkedList}
```
=== "TypeScript"
```typescript title="linear_search.ts"
[class]{}-[func]{linearSearchLinkedList}
```
=== "C"
```c title="linear_search.c"
[class]{}-[func]{linearSearchLinkedList}
```
=== "C#"
```csharp title="linear_search.cs"
[class]{linear_search}-[func]{linearSearchLinkedList}
```
=== "Swift"
```swift title="linear_search.swift"
[class]{}-[func]{linearSearchLinkedList}
```
=== "Zig"
```zig title="linear_search.zig"
[class]{}-[func]{linearSearchLinkedList}
```
## 复杂度分析
**时间复杂度 $O(n)$** :其中 $n$ 代表数组或链表的长度。
**空间复杂度 $O(1)$** :无需借助额外的存储空间。
## 优点与局限性
**线性查找具有极佳的通用性**。由于线性查找是逐个访问元素的,没有跳跃式访问,因此适用于数组和链表的查找。
**线性查找的时间复杂度较高**。当数据量 $n$ 较大时,线性查找的效率较低。

@ -1,14 +1,6 @@
# 权衡时间与空间
# 哈希优化策略
理想情况下,我们希望算法的时间复杂度和空间复杂度都能达到最优。然而在实际情况中,同时优化时间复杂度和空间复杂度通常是非常困难的。
**降低时间复杂度通常需要以提升空间复杂度为代价,反之亦然**。我们将牺牲内存空间来提升算法运行速度的思路称为「以空间换时间」;反之,则称之为「以时间换空间」。
选择哪种思路取决于我们更看重哪个方面。在大多数情况下,时间比空间更宝贵,因此以空间换时间通常是更常用的策略。当然,在数据量很大的情况下,控制空间复杂度也是非常重要的。
## 示例题目 *
以 LeetCode 全站第一题 [两数之和](https://leetcode.cn/problems/two-sum/) 为例。
在算法题中,**我们时常通过将线性查找替换为哈希查找来降低算法的时间复杂度**。以 LeetCode 全站第一题 [两数之和](https://leetcode.cn/problems/two-sum/) 为例。
!!! question "两数之和"
@ -18,11 +10,11 @@
你可以按任意顺序返回答案。
「暴力枚举」和「辅助哈希表」分别对应“空间最优”和“时间最优”的两种解法。遵循时间比空间更宝贵的原则,后者是本题的最佳解法。
## 线性查找:以时间换空间
### 方法一:暴力枚举
考虑直接遍历所有可能的组合。开启一个两层循环,在每轮中判断两个整数的和是否为 `target` ,若是,则返回它们的索引。
考虑直接遍历所有可能的组合。通过开启一个两层循环,判断两个整数的和是否为 `target` ,若是,则返回它们的索引(即下标)。
(图)
=== "Java"
@ -84,15 +76,17 @@
[class]{}-[func]{twoSumBruteForce}
```
方法的时间复杂度为 $O(n^2)$ ,空间复杂度为 $O(1)$ **属于以时间换空间**。此方法时间复杂度太高,在大数据量下非常耗时。
方法的时间复杂度为 $O(n^2)$ ,空间复杂度为 $O(1)$ ,在大数据量下非常耗时。
### 方法二:辅助哈希表
## 哈希查找:以空间换时间
考虑借助一个哈希表,key-value 分别为数组元素和元素索引。循环遍历数组中的每个元素 num并执行:
考虑借助一个哈希表,将数组元素和元素索引构建为键值对。循环遍历数组中的每个元素 `num` 并执行:
1. 判断数字 `target - num` 是否在哈希表中,若是则直接返回该两个元素的索引;
2. 将元素 `num` 和其索引添加进哈希表;
(图)
=== "Java"
```java title="leetcode_two_sum.java"
@ -153,4 +147,6 @@
[class]{}-[func]{twoSumHashTable}
```
该方法的时间复杂度为 $O(N)$ ,空间复杂度为 $O(N)$ **体现了以空间换时间**。尽管此方法引入了额外的空间使用,但在时间和空间的整体效率更为均衡,因此它是本题的最优解法。
此方法通过哈希查找将时间复杂度从 $O(n^2)$ 降低至 $O(n)$ ,大幅提升运行效率。
由于需要维护一个额外的哈希表,因此空间复杂度为 $O(n)$ 。**尽管如此,该方法的整体时空效率更为均衡,因此它是本题的最优解法**。

Binary file not shown.

After

Width:  |  Height:  |  Size: 102 KiB

@ -0,0 +1,81 @@
# 搜索算法
「搜索算法 Searching Algorithm」用于在数据结构例如数组、链表、树或图中搜索一个或一组满足特定条件的元素。
我们已经学过数组、链表、树和图的遍历方法,也学过哈希表、二叉搜索树等可用于实现查询的复杂数据结构。因此,搜索算法对于我们来说并不陌生。在本节,我们将从更加系统的视角切入,重新审视搜索算法。
## 暴力搜索
暴力搜索通过遍历数据结构的每个元素来定位目标元素。
- 「线性搜索」适用于数组和链表等线性数据结构。它从数据结构的一端开始,逐个访问元素,直到找到目标元素或到达另一端仍没有找到目标元素为止。
- 「广度优先搜索」和「深度优先搜索」是图和树的两种遍历策略。广度优先搜索从初始节点开始逐层搜索,由近及远地访问各个节点。深度优先搜索是从初始节点开始,沿着一条路径走到头为止,再回溯并尝试其他路径,直到遍历完整个数据结构。
暴力搜索的优点是简单且通用性好,**无需对数据做预处理和借助额外的数据结构**。
然而,**此类算法的时间复杂度为 $O(n)$** ,其中 $n$ 为元素数量,因此在数据量较大的情况下性能较差。
## 自适应搜索
自适应搜索利用数据的特有属性(例如有序性)来优化搜索过程,从而更高效地定位目标元素。
- 「二分查找」利用数据的有序性实现高效查找,仅适用于数组。
- 「哈希查找」利用哈希表将搜索数据和目标数据建立为键值对映射,从而实现查询操作。
- 「树查找」在特定的树结构(例如二叉搜索树)中,基于比较节点值来快速排除节点,从而定位目标元素。
此类算法的优点是效率高,**时间复杂度可达到 $O(\log n)$ 甚至 $O(1)$** 。
然而,**使用这些算法往往需要对数据进行预处理**。例如,二分查找需要预先对数组进行排序,哈希查找和树查找都需要借助额外的数据结构,维护这些数据结构也需要额外的时间和空间开支。
!!! note
自适应搜索算法常被称为查找算法,**主要关注在特定数据结构中快速检索目标元素**。
## 搜索方法选取
给定大小为 $n$ 的一组数据,我们可以使用线性搜索、二分查找、树查找、哈希查找等多种方法在该数据中搜索目标元素。各个方法的工作原理如下图所示。
![多种搜索策略](searching_algorithm_revisited.assets/searching_algorithms.png)
上述几种方法的操作效率与特性如下表所示。
<div class="center-table" markdown>
| | 线性搜索 | 二分查找 | 树查找 | 哈希查找 |
| ------------ | -------- | ------------------ | ------------------ | --------------- |
| 查找元素 | $O(n)$ | $O(\log n)$ | $O(\log n)$ | $O(1)$ |
| 插入元素 | $O(1)$ | $O(n)$ | $O(\log n)$ | $O(1)$ |
| 删除元素 | $O(n)$ | $O(n)$ | $O(\log n)$ | $O(1)$ |
| 额外空间 | $O(1)$ | $O(1)$ | $O(n)$ | $O(n)$ |
| 数据预处理 | / | 排序 $O(n \log n)$ | 建树 $O(n \log n)$ | 建哈希表 $O(n)$ |
| 数据是否有序 | 无序 | 有序 | 有序 | 无序 |
</div>
除了以上表格内容,搜索算法的选择还取决于数据体量、搜索性能要求、数据查询与更新频率等。
**线性搜索**
- 通用性较好,无需任何数据预处理操作。加入我们仅需查询一次数据,那么其他三种方法的数据预处理的时间比线性搜索的时间还要更长。
- 适用于体量较小的数据,此情况下时间复杂度对效率影响较小。
- 适用于数据更新频率较高的场景,因为该方法不需要对数据进行任何额外维护。
**二分查找**
- 适用于大数据量的情况,效率表现稳定,最差时间复杂度为 $O(\log n)$ 。
- 数据量不能过大,因为存储数组需要连续的内存空间。
- 不适用于高频增删数据的场景,因为维护有序数组的开销较大。
**哈希查找**
- 适合对查询性能要求很高的场景,平均时间复杂度为 $O(1)$ 。
- 不适合需要有序数据或范围查找的场景,因为哈希表无法维护数据的有序性。
- 对哈希函数和哈希冲突处理策略的依赖性较高,具有较大的性能劣化风险。
- 不适合数据量过大的情况,因为哈希表需要额外空间来最大程度地减少冲突,从而提供良好的查询性能。
**树查找**
- 适用于海量数据,因为树节点在内存中是离散存储的。
- 适合需要维护有序数据或范围查找的场景。
- 在持续增删节点的过程中,二叉搜索树可能产生倾斜,时间复杂度劣化至 $O(n)$ 。
- 若使用 AVL 树或红黑树,则各项操作可在 $O(\log n)$ 效率下稳定运行,但维护树平衡的操作会增加额外开销。

@ -1,16 +1,8 @@
# 小结
- 线性查找通过遍历数据结构并进行条件判断来完成查找任务。
- 二分查找依赖于数据的有序性,通过循环逐步缩减一半搜索区间来实现查找。它要求输入数据有序,且仅适用于数组或基于数组实现的数据结构。
- 哈希查找利用哈希表实现常数阶时间复杂度的查找操作,体现了空间换时间的算法思维。
- 下表概括并对比了三种查找算法的特性和时间复杂度。
<div class="center-table" markdown>
| | 线性查找 | 二分查找 | 哈希查找 |
| ------------------------------------- | ------------------------ | ----------------------------- | ------------------------ |
| 适用数据结构 | 数组、链表 | 有序数组 | 数组、链表 |
| 时间复杂度</br>(查找,插入,删除) | $O(n)$ , $O(1)$ , $O(n)$ | $O(\log n)$ , $O(n)$ , $O(n)$ | $O(1)$ , $O(1)$ , $O(1)$ |
| 空间复杂度 | $O(1)$ | $O(1)$ | $O(n)$ |
</div>
- 暴力搜索通过遍历数据结构来定位数据。线性搜索适用于数组和链表,广度优先搜索和深度优先搜索适用于图和树。此类算法通用性好,无需对数据预处理,但时间复杂度 $O(n)$ 较高。
- 哈希查找、树查找和二分查找属于高效搜索方法,可在特定数据结构中快速定位目标元素。此类算法效率高,时间复杂度可达 $O(\log n)$ 甚至 $O(1)$ ,但通常需要借助额外数据结构。
- 实际中,我们需要对数据体量、搜索性能要求、数据查询和更新频率等因素进行具体分析,从而选择合适的搜索方法。
- 线性搜索适用于小型或频繁更新的数据;二分查找适用于大型、排序的数据;哈希查找适合对查询效率要求较高且无需范围查询的数据;树查找适用于需要维护顺序和支持范围查询的大型动态数据。
- 用哈希查找替换线性查找是一种常用的优化运行时间的策略,可将时间复杂度从 $O(n)$ 降低至 $O(1)$ 。

@ -268,36 +268,21 @@
## 二叉搜索树的效率
假设给定 $n$ 个数字,最常见的存储方式是「数组」。对于这串乱序的数字,常见操作的效率如下:
给定一组数据,我们考虑使用数组或二叉搜索树存储。
- **查找元素**:由于数组是无序的,因此需要遍历数组来确定,使用 $O(n)$ 时间;
- **插入元素**:只需将元素添加至数组尾部即可,使用 $O(1)$ 时间;
- **删除元素**:先查找元素,使用 $O(n)$ 时间,再在数组中删除该元素,使用 $O(n)$ 时间;
- **获取最小 / 最大元素**:需要遍历数组来确定,使用 $O(n)$ 时间;
为了获得先验信息,我们可以预先将数组元素进行排序,得到一个「排序数组」。此时操作效率如下:
- **查找元素**:由于数组已排序,可以使用二分查找,平均使用 $O(\log n)$ 时间;
- **插入元素**:先查找插入位置,使用 $O(\log n)$ 时间,再插入到指定位置,使用 $O(n)$ 时间;
- **删除元素**:先查找元素,使用 $O(\log n)$ 时间,再在数组中删除该元素,使用 $O(n)$ 时间;
- **获取最小 / 最大元素**:数组头部和尾部元素即是最小和最大元素,使用 $O(1)$ 时间;
观察可知,无序数组和有序数组中的各项操作的时间复杂度呈现“偏科”的特点,即有的快有的慢。**然而,二叉搜索树的各项操作的时间复杂度都是对数阶,在数据量 $n$ 较大时具有显著优势**。
观察可知,二叉搜索树的各项操作的时间复杂度都是对数阶,具有稳定且高效的性能表现。只有在高频添加、低频查找删除的数据适用场景下,数组比二叉搜索树的效率更高。
<div class="center-table" markdown>
| | 无序数组 | 有序数组 | 二叉搜索树 |
| ------------------- | -------- | ----------- | ----------- |
| 查找指定元素 | $O(n)$ | $O(\log n)$ | $O(\log n)$ |
| 插入元素 | $O(1)$ | $O(n)$ | $O(\log n)$ |
| 删除元素 | $O(n)$ | $O(n)$ | $O(\log n)$ |
| 获取最小 / 最大元素 | $O(n)$ | $O(1)$ | $O(\log n)$ |
| | 无序数组 | 二叉搜索树 |
| -------- | -------- | ----------- |
| 查找元素 | $O(n)$ | $O(\log n)$ |
| 插入元素 | $O(1)$ | $O(\log n)$ |
| 删除元素 | $O(n)$ | $O(\log n)$ |
</div>
## 二叉搜索树的退化
在理想情况下,我们希望二叉搜索树是“平衡”的,这样就可以在 $\log n$ 轮循环内查找任意节点。
在理想情况下,二叉搜索树是“平衡”的,这样就可以在 $\log n$ 轮循环内查找任意节点。
然而,如果我们在二叉搜索树中不断地插入和删除节点,可能导致二叉树退化为链表,这时各种操作的时间复杂度也会退化为 $O(n)$ 。

@ -136,8 +136,7 @@ nav:
- 2.1. &nbsp; 算法效率评估: chapter_computational_complexity/performance_evaluation.md
- 2.2. &nbsp; 时间复杂度: chapter_computational_complexity/time_complexity.md
- 2.3. &nbsp; 空间复杂度: chapter_computational_complexity/space_complexity.md
- 2.4. &nbsp; 权衡时间与空间: chapter_computational_complexity/space_time_tradeoff.md
- 2.5. &nbsp; 小结: chapter_computational_complexity/summary.md
- 2.4. &nbsp; 小结: chapter_computational_complexity/summary.md
- 3. &nbsp; &nbsp; 数据结构简介:
- 3.1. &nbsp; 数据与内存: chapter_data_structure/data_and_memory.md
- 3.2. &nbsp; 数据结构分类: chapter_data_structure/classification_of_data_structure.md
@ -152,44 +151,45 @@ nav:
- 5.2. &nbsp; 队列: chapter_stack_and_queue/queue.md
- 5.3. &nbsp; 双向队列: chapter_stack_and_queue/deque.md
- 5.4. &nbsp; 小结: chapter_stack_and_queue/summary.md
- 6. &nbsp; &nbsp; 散列表:
- 6.1. &nbsp; 哈希表: chapter_hashing/hash_map.md
- 6.2. &nbsp; 哈希冲突处理: chapter_hashing/hash_collision.md
- 6.3. &nbsp; 小结: chapter_hashing/summary.md
- 7. &nbsp; &nbsp; 树:
- 7.1. &nbsp; 二叉树: chapter_tree/binary_tree.md
- 7.2. &nbsp; 二叉树遍历: chapter_tree/binary_tree_traversal.md
- 7.3. &nbsp; 二叉搜索树: chapter_tree/binary_search_tree.md
- 7.4. &nbsp; AVL 树 *: chapter_tree/avl_tree.md
- 7.5. &nbsp; 小结: chapter_tree/summary.md
- 8. &nbsp; &nbsp; 堆:
- 8.1. &nbsp; 堆: chapter_heap/heap.md
- 8.2. &nbsp; 建堆操作 *: chapter_heap/build_heap.md
- 8.3. &nbsp; 小结: chapter_heap/summary.md
- 9. &nbsp; &nbsp; 图:
- 9.1. &nbsp; 图: chapter_graph/graph.md
- 9.2. &nbsp; 图基础操作: chapter_graph/graph_operations.md
- 9.3. &nbsp; 图的遍历: chapter_graph/graph_traversal.md
- 9.4. &nbsp; 小结: chapter_graph/summary.md
- 10. &nbsp; &nbsp; 查找算法:
- 10.1. &nbsp; 线性查找: chapter_searching/linear_search.md
- 10.2. &nbsp; 二分查找: chapter_searching/binary_search.md
- 10.3. &nbsp; 哈希查找: chapter_searching/hashing_search.md
- 10.4. &nbsp; 小结: chapter_searching/summary.md
- 6. &nbsp; &nbsp; 二分查找:
- 6.1. &nbsp; 二分查找: chapter_binary_search/binary_search.md
- 7. &nbsp; &nbsp; 散列表:
- 7.1. &nbsp; 哈希表: chapter_hashing/hash_map.md
- 7.2. &nbsp; 哈希冲突处理: chapter_hashing/hash_collision.md
- 7.3. &nbsp; 小结: chapter_hashing/summary.md
- 8. &nbsp; &nbsp; 树:
- 8.1. &nbsp; 二叉树: chapter_tree/binary_tree.md
- 8.2. &nbsp; 二叉树遍历: chapter_tree/binary_tree_traversal.md
- 8.3. &nbsp; 二叉搜索树: chapter_tree/binary_search_tree.md
- 8.4. &nbsp; AVL 树 *: chapter_tree/avl_tree.md
- 8.5. &nbsp; 小结: chapter_tree/summary.md
- 9. &nbsp; &nbsp; 堆:
- 9.1. &nbsp; 堆: chapter_heap/heap.md
- 9.2. &nbsp; 建堆操作 *: chapter_heap/build_heap.md
- 9.3. &nbsp; 小结: chapter_heap/summary.md
- 10. &nbsp; &nbsp; 图:
- 10.1. &nbsp; 图: chapter_graph/graph.md
- 10.2. &nbsp; 图基础操作: chapter_graph/graph_operations.md
- 10.3. &nbsp; 图的遍历: chapter_graph/graph_traversal.md
- 10.4. &nbsp; 小结: chapter_graph/summary.md
- 11. &nbsp; &nbsp; 排序算法:
- 11.1. &nbsp; 排序算法: chapter_sorting/sorting_algorithm.md
- 11.2. &nbsp; 冒泡排序: chapter_sorting/bubble_sort.md
- 11.3. &nbsp; 插入排序: chapter_sorting/insertion_sort.md
- 11.4. &nbsp; 快速排序: chapter_sorting/quick_sort.md
- 11.5. &nbsp; 归并排序: chapter_sorting/merge_sort.md
- 11.6. &nbsp; 桶排序New: chapter_sorting/bucket_sort.md
- 11.7. &nbsp; 计数排序New: chapter_sorting/counting_sort.md
- 11.8. &nbsp; 基数排序New: chapter_sorting/radix_sort.md
- 11.6. &nbsp; 桶排序: chapter_sorting/bucket_sort.md
- 11.7. &nbsp; 计数排序: chapter_sorting/counting_sort.md
- 11.8. &nbsp; 基数排序: chapter_sorting/radix_sort.md
- 11.9. &nbsp; 小结: chapter_sorting/summary.md
- 12. &nbsp; &nbsp; 回溯算法:
- 12.1. &nbsp; 回溯算法New: chapter_backtracking/backtracking_algorithm.md
- 13. &nbsp; &nbsp; 附录:
- 13.1. &nbsp; 编程环境安装: chapter_appendix/installation.md
- 13.2. &nbsp; 一起参与创作: chapter_appendix/contribution.md
- 12. &nbsp; &nbsp; 搜索算法:
- 12.1. &nbsp; 搜索算法New: chapter_searching/searching_algorithm_revisited.md
- 12.2. &nbsp; 哈希优化策略: chapter_searching/replace_linear_by_hashing.md
- 12.3. &nbsp; 小结: chapter_searching/summary.md
- 13. &nbsp; &nbsp; 回溯算法:
- 13.1. &nbsp; 回溯算法New: chapter_backtracking/backtracking_algorithm.md
- 14. &nbsp; &nbsp; 附录:
- 14.1. &nbsp; 编程环境安装: chapter_appendix/installation.md
- 14.2. &nbsp; 一起参与创作: chapter_appendix/contribution.md
- 参考文献:
- chapter_reference/index.md

Loading…
Cancel
Save