2.4. 小结¶
算法效率评估
- 时间效率和空间效率是评价算法性能的两个关键维度。
- 我们可以通过实际测试来评估算法效率,但难以消除测试环境的影响,且会耗费大量计算资源。
- 复杂度分析可以克服实际测试的弊端,分析结果适用于所有运行平台,并且能够揭示算法在不同数据规模下的效率。
时间复杂度
- 时间复杂度用于衡量算法运行时间随数据量增长的趋势,可以有效评估算法效率,但在某些情况下可能失效,如在输入数据量较小或时间复杂度相同时,无法精确对比算法效率的优劣。
- 最差时间复杂度使用大 \(O\) 符号表示,即函数渐近上界,反映当 \(n\) 趋向正无穷时,\(T(n)\) 的增长级别。
- 推算时间复杂度分为两步,首先统计计算操作数量,然后判断渐近上界。
- 常见时间复杂度从小到大排列有 \(O(1)\) , \(O(\log n)\) , \(O(n)\) , \(O(n \log n)\) , \(O(n^2)\) , \(O(2^n)\) , \(O(n!)\) 等。
- 某些算法的时间复杂度非固定,而是与输入数据的分布有关。时间复杂度分为最差、最佳、平均时间复杂度,最佳时间复杂度几乎不用,因为输入数据一般需要满足严格条件才能达到最佳情况。
- 平均时间复杂度反映算法在随机数据输入下的运行效率,最接近实际应用中的算法性能。计算平均时间复杂度需要统计输入数据分布以及综合后的数学期望。
空间复杂度
- 类似于时间复杂度,空间复杂度用于衡量算法占用空间随数据量增长的趋势。
- 算法运行过程中的相关内存空间可分为输入空间、暂存空间、输出空间。通常情况下,输入空间不计入空间复杂度计算。暂存空间可分为指令空间、数据空间、栈帧空间,其中栈帧空间通常仅在递归函数中影响空间复杂度。
- 我们通常只关注最差空间复杂度,即统计算法在最差输入数据和最差运行时间点下的空间复杂度。
- 常见空间复杂度从小到大排列有 \(O(1)\) , \(O(\log n)\) , \(O(n)\) , \(O(n^2)\) , \(O(2^n)\) 等。
2.4.1. Q & A¶
尾递归的空间复杂度是 \(O(1)\) 吗?
理论上,尾递归函数的空间复杂度可以被优化至 \(O(1)\) 。不过绝大多数编程语言(例如 Java, Python, C++, Go, C# 等)都不支持自动优化尾递归,因此通常认为空间复杂度是 \(O(n)\) 。
函数和方法这两个术语的区别是什么?
函数(function)可以独立被执行,所有参数都以显式传递。方法(method)与一个对象关联,方法被隐式传递给调用它的对象,方法能够对类的实例中包含的数据进行操作。
以几个常见的编程语言为例:
- C 语言是过程式编程语言,没有面向对象的概念,所以只有函数。但我们可以通过创建结构(struct)来模拟面向对象编程,与结构体相关联的函数就相当于其他语言中的方法。
- Java, C# 是面向对象的编程语言,代码块(方法)通常都是作为某个类的一部分。静态方法的行为类似于函数,因为它被绑定在类上,不能访问特定的实例变量。
- C++, Python 既支持过程式编程(函数)也支持面向对象编程(方法)。
图片“空间复杂度的常见类型”反映的是否是占用空间的绝对大小?
不是,该图片展示的是空间复杂度,其反映的是即增长趋势,而不是占用空间的绝对大小。
假设取 \(n = 8\) ,你可能会发现每条曲线的值与函数对应不上。这是因为每条曲线都包含一个常数项,用于将取值范围压缩到一个视觉舒适的范围内。
在实际中,因为我们通常不知道每个方法的“常数项”复杂度是多少,所以一般无法仅凭复杂度来选择 \(n = 8\) 之下的最优解法。但对于 \(n = 8^5\) 就很好选了,这时增长趋势已经占主导了。