--- comments: true --- # 11.5.   归并排序 「归并排序 Merge Sort」基于分治思想实现排序,包含“划分”和“合并”两个阶段: 1. **划分阶段**:通过递归不断地将数组从中点处分开,将长数组的排序问题转换为短数组的排序问题; 2. **合并阶段**:当子数组长度为 1 时终止划分,开始合并,持续地将左右两个较短的有序数组合并为一个较长的有序数组,直至结束; ![归并排序的划分与合并阶段](merge_sort.assets/merge_sort_overview.png)

Fig. 归并排序的划分与合并阶段

## 11.5.1.   算法流程 “划分阶段”从顶至底递归地将数组从中点切为两个子数组,直至长度为 1 ; 1. 计算数组中点 `mid` ,递归划分左子数组(区间 `[left, mid]` )和右子数组(区间 `[mid + 1, right]` ); 2. 递归执行步骤 `1.` ,直至子数组区间长度为 1 时,终止递归划分; “合并阶段”从底至顶地将左子数组和右子数组合并为一个有序数组。需要注意的是,从长度为 1 的子数组开始合并,合并阶段中的每个子数组都是有序的。 === "<1>" ![归并排序步骤](merge_sort.assets/merge_sort_step1.png) === "<2>" ![merge_sort_step2](merge_sort.assets/merge_sort_step2.png) === "<3>" ![merge_sort_step3](merge_sort.assets/merge_sort_step3.png) === "<4>" ![merge_sort_step4](merge_sort.assets/merge_sort_step4.png) === "<5>" ![merge_sort_step5](merge_sort.assets/merge_sort_step5.png) === "<6>" ![merge_sort_step6](merge_sort.assets/merge_sort_step6.png) === "<7>" ![merge_sort_step7](merge_sort.assets/merge_sort_step7.png) === "<8>" ![merge_sort_step8](merge_sort.assets/merge_sort_step8.png) === "<9>" ![merge_sort_step9](merge_sort.assets/merge_sort_step9.png) === "<10>" ![merge_sort_step10](merge_sort.assets/merge_sort_step10.png) 观察发现,归并排序的递归顺序与二叉树的后序遍历相同,具体来看: - **后序遍历**:先递归左子树,再递归右子树,最后处理根节点。 - **归并排序**:先递归左子数组,再递归右子数组,最后处理合并。 === "Java" ```java title="merge_sort.java" /* 合并左子数组和右子数组 */ // 左子数组区间 [left, mid] // 右子数组区间 [mid + 1, right] void merge(int[] nums, int left, int mid, int right) { // 初始化辅助数组 int[] tmp = Arrays.copyOfRange(nums, left, right + 1); // 左子数组的起始索引和结束索引 int leftStart = left - left, leftEnd = mid - left; // 右子数组的起始索引和结束索引 int rightStart = mid + 1 - left, rightEnd = right - left; // i, j 分别指向左子数组、右子数组的首元素 int i = leftStart, j = rightStart; // 通过覆盖原数组 nums 来合并左子数组和右子数组 for (int k = left; k <= right; k++) { // 若“左子数组已全部合并完”,则选取右子数组元素,并且 j++ if (i > leftEnd) nums[k] = tmp[j++]; // 否则,若“右子数组已全部合并完”或“左子数组元素 <= 右子数组元素”,则选取左子数组元素,并且 i++ else if (j > rightEnd || tmp[i] <= tmp[j]) nums[k] = tmp[i++]; // 否则,若“左右子数组都未全部合并完”且“左子数组元素 > 右子数组元素”,则选取右子数组元素,并且 j++ else nums[k] = tmp[j++]; } } /* 归并排序 */ void mergeSort(int[] nums, int left, int right) { // 终止条件 if (left >= right) return; // 当子数组长度为 1 时终止递归 // 划分阶段 int mid = (left + right) / 2; // 计算中点 mergeSort(nums, left, mid); // 递归左子数组 mergeSort(nums, mid + 1, right); // 递归右子数组 // 合并阶段 merge(nums, left, mid, right); } ``` === "C++" ```cpp title="merge_sort.cpp" /* 合并左子数组和右子数组 */ // 左子数组区间 [left, mid] // 右子数组区间 [mid + 1, right] void merge(vector &nums, int left, int mid, int right) { // 初始化辅助数组 vector tmp(nums.begin() + left, nums.begin() + right + 1); // 左子数组的起始索引和结束索引 int leftStart = left - left, leftEnd = mid - left; // 右子数组的起始索引和结束索引 int rightStart = mid + 1 - left, rightEnd = right - left; // i, j 分别指向左子数组、右子数组的首元素 int i = leftStart, j = rightStart; // 通过覆盖原数组 nums 来合并左子数组和右子数组 for (int k = left; k <= right; k++) { // 若“左子数组已全部合并完”,则选取右子数组元素,并且 j++ if (i > leftEnd) nums[k] = tmp[j++]; // 否则,若“右子数组已全部合并完”或“左子数组元素 <= 右子数组元素”,则选取左子数组元素,并且 i++ else if (j > rightEnd || tmp[i] <= tmp[j]) nums[k] = tmp[i++]; // 否则,若“左右子数组都未全部合并完”且“左子数组元素 > 右子数组元素”,则选取右子数组元素,并且 j++ else nums[k] = tmp[j++]; } } /* 归并排序 */ void mergeSort(vector &nums, int left, int right) { // 终止条件 if (left >= right) return; // 当子数组长度为 1 时终止递归 // 划分阶段 int mid = (left + right) / 2; // 计算中点 mergeSort(nums, left, mid); // 递归左子数组 mergeSort(nums, mid + 1, right); // 递归右子数组 // 合并阶段 merge(nums, left, mid, right); } ``` === "Python" ```python title="merge_sort.py" def merge(nums: list[int], left: int, mid: int, right: int) -> None: """合并左子数组和右子数组""" # 左子数组区间 [left, mid] # 右子数组区间 [mid + 1, right] # 初始化辅助数组 tmp: list[int] = list(nums[left : right + 1]) # 左子数组的起始索引和结束索引 left_start: int = 0 left_end: int = mid - left # 右子数组的起始索引和结束索引 right_start: int = mid + 1 - left right_end: int = right - left # i, j 分别指向左子数组、右子数组的首元素 i: int = left_start j: int = right_start # 通过覆盖原数组 nums 来合并左子数组和右子数组 for k in range(left, right + 1): # 若“左子数组已全部合并完”,则选取右子数组元素,并且 j++ if i > left_end: nums[k] = tmp[j] j += 1 # 否则,若“右子数组已全部合并完”或“左子数组元素 <= 右子数组元素”,则选取左子数组元素,并且 i++ elif j > right_end or tmp[i] <= tmp[j]: nums[k] = tmp[i] i += 1 # 否则,若“左右子数组都未全部合并完”且“左子数组元素 > 右子数组元素”,则选取右子数组元素,并且 j++ else: nums[k] = tmp[j] j += 1 def merge_sort(nums: list[int], left: int, right: int) -> None: """归并排序""" # 终止条件 if left >= right: return # 当子数组长度为 1 时终止递归 # 划分阶段 mid: int = (left + right) // 2 # 计算中点 merge_sort(nums, left, mid) # 递归左子数组 merge_sort(nums, mid + 1, right) # 递归右子数组 # 合并阶段 merge(nums, left, mid, right) ``` === "Go" ```go title="merge_sort.go" /* 合并左子数组和右子数组 */ // 左子数组区间 [left, mid] // 右子数组区间 [mid + 1, right] func merge(nums []int, left, mid, right int) { // 初始化辅助数组 借助 copy 模块 tmp := make([]int, right-left+1) for i := left; i <= right; i++ { tmp[i-left] = nums[i] } // 左子数组的起始索引和结束索引 leftStart, leftEnd := left-left, mid-left // 右子数组的起始索引和结束索引 rightStart, rightEnd := mid+1-left, right-left // i, j 分别指向左子数组、右子数组的首元素 i, j := leftStart, rightStart // 通过覆盖原数组 nums 来合并左子数组和右子数组 for k := left; k <= right; k++ { // 若“左子数组已全部合并完”,则选取右子数组元素,并且 j++ if i > leftEnd { nums[k] = tmp[j] j++ // 否则,若“右子数组已全部合并完”或“左子数组元素 <= 右子数组元素”,则选取左子数组元素,并且 i++ } else if j > rightEnd || tmp[i] <= tmp[j] { nums[k] = tmp[i] i++ // 否则,若“左右子数组都未全部合并完”且“左子数组元素 > 右子数组元素”,则选取右子数组元素,并且 j++ } else { nums[k] = tmp[j] j++ } } } /* 归并排序 */ func mergeSort(nums []int, left, right int) { // 终止条件 if left >= right { return } // 划分阶段 mid := (left + right) / 2 mergeSort(nums, left, mid) mergeSort(nums, mid+1, right) // 合并阶段 merge(nums, left, mid, right) } ``` === "JavaScript" ```javascript title="merge_sort.js" /* 合并左子数组和右子数组 */ // 左子数组区间 [left, mid] // 右子数组区间 [mid + 1, right] function merge(nums, left, mid, right) { // 初始化辅助数组 let tmp = nums.slice(left, right + 1); // 左子数组的起始索引和结束索引 let leftStart = left - left, leftEnd = mid - left; // 右子数组的起始索引和结束索引 let rightStart = mid + 1 - left, rightEnd = right - left; // i, j 分别指向左子数组、右子数组的首元素 let i = leftStart, j = rightStart; // 通过覆盖原数组 nums 来合并左子数组和右子数组 for (let k = left; k <= right; k++) { if (i > leftEnd) { // 若“左子数组已全部合并完”,则选取右子数组元素,并且 j++ nums[k] = tmp[j++]; } else if (j > rightEnd || tmp[i] <= tmp[j]) { // 否则,若“右子数组已全部合并完”或“左子数组元素 <= 右子数组元素”,则选取左子数组元素,并且 i++ nums[k] = tmp[i++]; } else { // 否则,若“左右子数组都未全部合并完”且“左子数组元素 > 右子数组元素”,则选取右子数组元素,并且 j++ nums[k] = tmp[j++]; } } } /* 归并排序 */ function mergeSort(nums, left, right) { // 终止条件 if (left >= right) return; // 当子数组长度为 1 时终止递归 // 划分阶段 let mid = Math.floor((left + right) / 2); // 计算中点 mergeSort(nums, left, mid); // 递归左子数组 mergeSort(nums, mid + 1, right); // 递归右子数组 // 合并阶段 merge(nums, left, mid, right); } ``` === "TypeScript" ```typescript title="merge_sort.ts" /* 合并左子数组和右子数组 */ // 左子数组区间 [left, mid] // 右子数组区间 [mid + 1, right] function merge(nums: number[], left: number, mid: number, right: number): void { // 初始化辅助数组 let tmp = nums.slice(left, right + 1); // 左子数组的起始索引和结束索引 let leftStart = left - left, leftEnd = mid - left; // 右子数组的起始索引和结束索引 let rightStart = mid + 1 - left, rightEnd = right - left; // i, j 分别指向左子数组、右子数组的首元素 let i = leftStart, j = rightStart; // 通过覆盖原数组 nums 来合并左子数组和右子数组 for (let k = left; k <= right; k++) { if (i > leftEnd) { // 若“左子数组已全部合并完”,则选取右子数组元素,并且 j++ nums[k] = tmp[j++]; // 否则,若“右子数组已全部合并完”或“左子数组元素 <= 右子数组元素”,则选取左子数组元素,并且 i++ } else if (j > rightEnd || tmp[i] <= tmp[j]) { nums[k] = tmp[i++]; // 否则,若“左右子数组都未全部合并完”且“左子数组元素 > 右子数组元素”,则选取右子数组元素,并且 j++ } else { nums[k] = tmp[j++]; } } } /* 归并排序 */ function mergeSort(nums: number[], left: number, right: number): void { // 终止条件 if (left >= right) return; // 当子数组长度为 1 时终止递归 // 划分阶段 let mid = Math.floor((left + right) / 2); // 计算中点 mergeSort(nums, left, mid); // 递归左子数组 mergeSort(nums, mid + 1, right); // 递归右子数组 // 合并阶段 merge(nums, left, mid, right); } ``` === "C" ```c title="merge_sort.c" ``` === "C#" ```csharp title="merge_sort.cs" /* 合并左子数组和右子数组 */ // 左子数组区间 [left, mid] // 右子数组区间 [mid + 1, right] void merge(int[] nums, int left, int mid, int right) { // 初始化辅助数组 int[] tmp = nums[left..(right + 1)]; // 左子数组的起始索引和结束索引 int leftStart = left - left, leftEnd = mid - left; // 右子数组的起始索引和结束索引 int rightStart = mid + 1 - left, rightEnd = right - left; // i, j 分别指向左子数组、右子数组的首元素 int i = leftStart, j = rightStart; // 通过覆盖原数组 nums 来合并左子数组和右子数组 for (int k = left; k <= right; k++) { // 若“左子数组已全部合并完”,则选取右子数组元素,并且 j++ if (i > leftEnd) nums[k] = tmp[j++]; // 否则,若“右子数组已全部合并完”或“左子数组元素 <= 右子数组元素”,则选取左子数组元素,并且 i++ else if (j > rightEnd || tmp[i] <= tmp[j]) nums[k] = tmp[i++]; // 否则,若“左右子数组都未全部合并完”且“左子数组元素 > 右子数组元素”,则选取右子数组元素,并且 j++ else nums[k] = tmp[j++]; } } /* 归并排序 */ void mergeSort(int[] nums, int left, int right) { // 终止条件 if (left >= right) return; // 当子数组长度为 1 时终止递归 // 划分阶段 int mid = (left + right) / 2; // 计算中点 mergeSort(nums, left, mid); // 递归左子数组 mergeSort(nums, mid + 1, right); // 递归右子数组 // 合并阶段 merge(nums, left, mid, right); } ``` === "Swift" ```swift title="merge_sort.swift" /* 合并左子数组和右子数组 */ // 左子数组区间 [left, mid] // 右子数组区间 [mid + 1, right] func merge(nums: inout [Int], left: Int, mid: Int, right: Int) { // 初始化辅助数组 let tmp = Array(nums[left ..< (right + 1)]) // 左子数组的起始索引和结束索引 let leftStart = left - left let leftEnd = mid - left // 右子数组的起始索引和结束索引 let rightStart = mid + 1 - left let rightEnd = right - left // i, j 分别指向左子数组、右子数组的首元素 var i = leftStart var j = rightStart // 通过覆盖原数组 nums 来合并左子数组和右子数组 for k in left ... right { // 若“左子数组已全部合并完”,则选取右子数组元素,并且 j++ if i > leftEnd { nums[k] = tmp[j] j += 1 } // 否则,若“右子数组已全部合并完”或“左子数组元素 <= 右子数组元素”,则选取左子数组元素,并且 i++ else if j > rightEnd || tmp[i] <= tmp[j] { nums[k] = tmp[i] i += 1 } // 否则,若“左右子数组都未全部合并完”且“左子数组元素 > 右子数组元素”,则选取右子数组元素,并且 j++ else { nums[k] = tmp[j] j += 1 } } } /* 归并排序 */ func mergeSort(nums: inout [Int], left: Int, right: Int) { // 终止条件 if left >= right { // 当子数组长度为 1 时终止递归 return } // 划分阶段 let mid = (left + right) / 2 // 计算中点 mergeSort(nums: &nums, left: left, right: mid) // 递归左子数组 mergeSort(nums: &nums, left: mid + 1, right: right) // 递归右子数组 // 合并阶段 merge(nums: &nums, left: left, mid: mid, right: right) } ``` === "Zig" ```zig title="merge_sort.zig" // 合并左子数组和右子数组 // 左子数组区间 [left, mid] // 右子数组区间 [mid + 1, right] fn merge(nums: []i32, left: usize, mid: usize, right: usize) !void { // 初始化辅助数组 var mem_arena = std.heap.ArenaAllocator.init(std.heap.page_allocator); defer mem_arena.deinit(); const mem_allocator = mem_arena.allocator(); var tmp = try mem_allocator.alloc(i32, right + 1 - left); std.mem.copy(i32, tmp, nums[left..right+1]); // 左子数组的起始索引和结束索引 var leftStart = left - left; var leftEnd = mid - left; // 右子数组的起始索引和结束索引 var rightStart = mid + 1 - left; var rightEnd = right - left; // i, j 分别指向左子数组、右子数组的首元素 var i = leftStart; var j = rightStart; // 通过覆盖原数组 nums 来合并左子数组和右子数组 var k = left; while (k <= right) : (k += 1) { // 若“左子数组已全部合并完”,则选取右子数组元素,并且 j++ if (i > leftEnd) { nums[k] = tmp[j]; j += 1; // 否则,若“右子数组已全部合并完”或“左子数组元素 <= 右子数组元素”,则选取左子数组元素,并且 i++ } else if (j > rightEnd or tmp[i] <= tmp[j]) { nums[k] = tmp[i]; i += 1; // 否则,若“左右子数组都未全部合并完”且“左子数组元素 > 右子数组元素”,则选取右子数组元素,并且 j++ } else { nums[k] = tmp[j]; j += 1; } } } // 归并排序 fn mergeSort(nums: []i32, left: usize, right: usize) !void { // 终止条件 if (left >= right) return; // 当子数组长度为 1 时终止递归 // 划分阶段 var mid = (left + right) / 2; // 计算中点 try mergeSort(nums, left, mid); // 递归左子数组 try mergeSort(nums, mid + 1, right); // 递归右子数组 // 合并阶段 try merge(nums, left, mid, right); } ``` 合并方法 `merge()` 代码中的难点包括: - **在阅读代码时,需要特别注意各个变量的含义**。`nums` 的待合并区间为 `[left, right]` ,但由于 `tmp` 仅复制了 `nums` 该区间的元素,因此 `tmp` 对应区间为 `[0, right - left]` 。 - 在比较 `tmp[i]` 和 `tmp[j]` 的大小时,**还需考虑子数组遍历完成后的索引越界问题**,即 `i > leftEnd` 和 `j > rightEnd` 的情况。索引越界的优先级是最高的,如果左子数组已经被合并完了,那么不需要继续比较,直接合并右子数组元素即可。 ## 11.5.2.   算法特性 **时间复杂度 $O(n \log n)$** :划分产生高度为 $\log n$ 的递归树,每层合并的总操作数量为 $n$ ,因此总体时间复杂度为 $O(n \log n)$ 。 **空间复杂度 $O(n)$** :递归深度为 $\log n$ ,使用 $O(\log n)$ 大小的栈帧空间;合并操作需要借助辅助数组实现,使用 $O(n)$ 大小的额外空间;因此是“非原地排序”。 在合并过程中,相等元素的次序保持不变,因此归并排序是“稳定排序”。 ## 11.5.3.   链表排序 * 归并排序在排序链表时具有显著优势,空间复杂度可以优化至 $O(1)$ ,原因如下: - 由于链表仅需改变指针就可实现节点的增删操作,因此合并阶段(将两个短有序链表合并为一个长有序链表)无需创建辅助链表。 - 通过使用“迭代划分”替代“递归划分”,可省去递归使用的栈帧空间; 具体实现细节比较复杂,有兴趣的同学可以查阅相关资料进行学习。