算法时空复杂度

引言：为什么需要分析复杂度？

在编写代码时，我们不仅要确保代码能够正确地解决问题，还要确保它能够高效地解决问题。随着计算机处理的数据量越来越大，一个算法的效率变得至关重要。

一个低效的算法可能在处理小规模数据时表现尚可，但在处理大规模数据时就可能耗尽时间和内存，导致程序崩溃或用户等待时间过长。
通过分析算法的复杂度，我们可以：
预测算法在不同输入规模下的性能表现。
比较不同算法的优劣，选择最适合的解决方案。
优化算法，改进其效率。

算法的复杂度主要分为两类：时间复杂度和空间复杂度。它们通常使用大 O 标记法 (Big O Notation) 来表示。

1. 时间复杂度

时间复杂度是衡量算法运行时间与输入数据量（通常记为 $n$ ）之间关系的一个指标。它不是指算法执行的具体时间（因为这会受到电脑硬件、操作系统、编程语言等多种因素影响），而是指算法执行操作的数量随着输入规模增长的趋势。

1.1 大 O 标记法

大 O 标记法是一种数学工具，用于描述函数增长率的渐近上界。在算法分析中，它表示算法在最坏情况下的运行时间与输入规模的增长关系。

形式化定义：
如果存在常数 $c > 0$ 和 $n_0 > 0$ ，使得对于所有 $n \ge n_0$ ，有 $T(n) \le c \cdot g(n)$ ，则称 $T(n) = O(g(n))$ 。

其中：

$T(n)$ ：表示算法执行的总操作数。
$n$ ：表示输入数据的规模。
$g(n)$ ：一个简化的函数，代表算法操作数增长的趋势。

直观理解：
在大 O 标记法中，我们关注的是当 $n$ 趋近于无穷大时，算法运行时间的** मुख्य增长趋势**。这意味着：

忽略常数项： $O(2n)$ 和 $O(n)$ 在本质上是相同的，因为常数因子 $2$ 不影响增长趋势。
忽略低阶项： $O(n^2 + n + 1)$ 等同于 $O(n^2)$ ，因为当 $n$ 足够大时， $n^2$ 的增长速度远超 $n$ 和 $1$ 。

1.2 如何计算时间复杂度？

计算时间复杂度通常遵循以下原则：

基本操作： 算术运算 (加减乘除), 赋值, 比较, 数组元素的读取/写入等都视为一个常数时间操作，记为 $O(1)$ 。
顺序结构： 顺序执行的多段代码，总时间复杂度等于其中时间复杂度最大的那段代码。例如， $O(n) + O(1) = O(n)$ 。
循环结构： 循环体内的代码执行的次数乘以循环体的复杂度。

如果循环执行 $n$ 次，循环体是 $O(1)$ ，则总复杂度为 $O(n)$ 。
如果循环执行 $n$ 次，循环体是 $O(k)$ ，则总复杂度为 $O(nk)$ 。

嵌套循环： 各层循环的复杂度相乘。如果一个外层循环执行 $n$ 次，内层循环执行 $m$ 次，且内层循环体是 $O(1)$ ，则总复杂度为 $O(n \cdot m)$ 。
分支结构 (if/else)： 取各种分支中复杂度最大的那一个。
递归： 需要分析递归调用的次数和每次递归执行的工作量。通常可以通过递归树或主定理来分析。

1.3 常见的时间复杂度类别及示例

以下是一些常见的渐近时间复杂度，从快到慢（效率从高到低）：

复杂度类别	大 O 标记法	描述	示例
常数时间	$O(1)$	操作次数与输入规模无关。	访问数组元素 `arr[i]`、简单的数学运算、变量赋值。
对数时间	$O(\log n)$	每次操作将问题规模减半。	二分查找 (Binary Search)。
线性时间	$O(n)$	操作次数与输入规模成正比。	遍历数组、查找无序列表中的元素。
线性对数时间	$O(n \log n)$	典型的“分而治之”算法。	归并排序 (Merge Sort)、堆排序 (Heap Sort)、快速排序 (Quick Sort)。
平方时间	$O(n^2)$	两层嵌套循环，操作次数与输入规模的平方成正比。	冒泡排序 (Bubble Sort)、选择排序 (Selection Sort)、插入排序 (Insertion Sort)。
立方时间	$O(n^3)$	三层嵌套循环。	矩阵乘法。
指数时间	$O(2^n)$	操作次数呈指数增长，非常低效。	旅行商问题 (TSP) 的暴力解法、斐波那契数列的朴素递归实现。
阶乘时间	$O(n!)$	操作次数呈阶乘增长，极其低效。	生成所有排列组合。

示例分析：

$O(1)$ - 常数时间复杂度

int sum(int a, int b) {
    int result = a + b; // 1次加法, 1次赋值
    return result; // 1次返回
}
// 无论a和b的值多大，操作次数都是固定的，因此时间复杂度为 O(1)。

$O(n)$ - 线性时间复杂度

void printArray(const std::vector<int>& arr) {
    for (int i = 0; i < arr.size(); ++i) { // 循环执行 n 次 (arr.size() 为 n)
    	std::cout << arr[i] << " "; // 每次循环执行常数次操作
    }
    std::cout << std::endl;
}
// 循环执行 n 次，每次循环内部都是常数操作，因此总操作次数与 n 成正比，时间复杂度为 O(n)。

$O(n^2)$ - 平方时间复杂度

void printMatrix(const std::vector<std::vector<int>>& matrix) {
    int n = matrix.size();
    for (int i = 0; i < n; ++i) { // 外层循环执行 n 次
        for (int j = 0; j < n; ++j) { // 内层循环执行 n 次
        	std::cout << matrix[i][j] << " "; // 每次内层循环执行常数次操作
        }
        std::cout << std::endl;
    }
}
// 外层循环 n 次，内层循环 n 次，因此总操作次数为 n * n = n^2 次，时间复杂度为 O(n^2)。

$O(\log n)$ - 对数时间复杂度

// 二分查找 示例
int binarySearch(const std::vector<int>& arr, int target) {
    int low = 0;
    int high = arr.size() - 1;

    while (low <= high) { // 循环条件
        int mid = low + (high - low) / 2; // 常数操作
        if (arr[mid] == target) { // 常数操作
           return mid;
        } else if (arr[mid] < target) {
           low = mid + 1; // 范围变为原来的一半
        } else {
           high = mid - 1; // 范围变为原来的一半
        }
    }
    return -1;
}
// 每次循环，搜索的范围都减半。假设初始范围是 n，第一次循环后范围是 n/2，第二次是 n/4，
// 直到范围变为 1。设循环 k 次后范围变为 1，则有 n / (2^k) = 1，
// 即 n = 2^k。两边取对数，得到 k = log2(n)。
// 因此，循环次数与 log n 成正比，时间复杂度为 O(log n)。

2. 空间复杂度

空间复杂度是衡量算法在运行过程中，除了输入数据本身所占用的空间外，额外所需的内存空间与输入数据量 $n$ 之间关系的一个指标。它同样使用大 O 标记法来表示。

2.1 如何计算空间复杂度？

计算空间复杂度主要考虑以下几个方面：

变量： 算法中声明的简单变量（如 int, double, bool）通常占用常数空间 $O(1)$ 。
数据结构： 算法中使用的动态数据结构（如 std::vector, std::map, std::set 等）或为存储结果而创建的数据结构，其占用空间通常与其中存储的元素数量成正比。
递归调用栈： 递归算法在执行过程中，每次函数调用都会在调用栈上占用一定的空间（存储局部变量、参数、返回地址等）。递归的深度乘以每次调用的空间就是总的递归栈空间。

2.2 常见的空间复杂度类别及示例

$O(1)$ - 常数空间复杂度

int sum(int a, int b) {
    int result = a + b; // 仅创建了一个 int 类型的变量 result
    return result;
}
// 无论输入 a, b 的值多大，算法仅仅使用了常数个变量，不随输入规模变化，因此空间复杂度为 O(1)。

$O(n)$ - 线性空间复杂度

std::vector<int> copyArray(const std::vector<int>& arr) {
    std::vector<int> newArr; // 创建一个新的 vector
    newArr.reserve(arr.size()); // 预留空间，避免频繁扩容，但核心是存储 n 个元素
    for (int x : arr) {
    	newArr.push_back(x); // 将 arr 中的 n 个元素拷贝到 newArr
    }
    return newArr;
}
// 算法创建了一个新的 vector newArr，其大小与输入 arr 的大小 n 成正比。
// 因此额外空间占用与 n 成正比，空间复杂度为 O(n)。

$O(\log n)$ - 对数空间复杂度

// 递归实现的二分查找（通常非递归版本是 O(1) 空间）
int binarySearchRecursive(const std::vector<int>& arr, int target, int low, int high) {
    if (low > high) {
    	return -1;
    }
    int mid = low + (high - low) / 2;
    if (arr[mid] == target) {
    	return mid;
    } else if (arr[mid] < target) {
    	return binarySearchRecursive(arr, target, mid + 1, high); // 递归调用
    } else {
    	return binarySearchRecursive(arr, target, low, mid - 1); // 递归调用
    }
}
// 每次递归调用，问题规模减半，递归深度为 log n。
// 每个递归函数调用都会在栈上占用一些空间，因此总的栈空间占用与递归深度成正比。
// 空间复杂度为 O(log n)。

$O(n^2)$ - 平方空间复杂度

std::vector<std::vector<int>> createMatrix(int n) {
std::vector<std::vector<int>> matrix(n, std::vector<int>(n)); // 创建一个 n*n 的二维数组
	// 填充矩阵的操作不影响其空间复杂度
	return matrix;
}
// 算法创建了一个 n 行 n 列的二维数组，总共 n * n = n^2 个元素。
// 因此额外空间占用与 n^2 成正比，空间复杂度为 O(n^2)。

3. 关键概念和注意事项

最好、最坏和平均情况：

最坏情况 (Worst-Case)： 算法运行时间上限，这是大 O 标记法通常关注的。例如，在无序数组中查找一个元素，最坏情况是遍历整个数组都找不到或目标元素在最后。
最好情况 (Best-Case)： 算法运行时间下限。例如，在无序数组中查找一个元素，最好情况是目标元素就在数组的第一个位置。
平均情况 (Average-Case)： 对所有可能的输入，算法运行时间的期望值。通常比最坏情况更复杂，但更能反映实际性能。

均摊分析 (Amortized Analysis)：
某些操作在大多数时间里很快，但在少数情况可能会很慢（例如 std::vector 扩容）。均摊分析考虑了这一系列操作的平均成本，而不是最坏的单次操作。例如，虽然 std::vector::push_back 在扩容时是 $O(n)$ ，但在一系列 $n$ 次 push_back 操作中，总成本是 $O(n)$ ，因此每次操作的均摊成本是 $O(1)$ 。
时间-空间权衡 (Time-Space Trade-off)：
在很多问题中，可以通过牺牲一些空间来换取更快的时间，反之亦然。例如，使用哈希表 (Hash Map) 可以将查找时间从 $O(n)$ 降到平均 $O(1)$ ，但需要额外 $O(n)$ 的空间来存储哈希表。
常数因子和实际性能：
大 O 标记法忽略了常数因子。例如， $O(n)$ 的算法可能比一个常数因子很大的 $O(\log n)$ 算法在小规模 $n$ 下运行得更快。但在 $n$ 足够大时， $O(\log n)$ 最终会胜出。在实际应用中，常数因子有时也很重要，特别是对于性能敏感的场景。

总结

时间复杂度和空间复杂度是评估算法优劣的两个核心指标。

时间复杂度 关注算法执行操作数的增长趋势，反映了算法的执行效率。
空间复杂度 关注算法额外占用内存的增长趋势，反映了算法的资源消耗。

#C++

算法时空复杂度

https://hb2cpc.top/2025/09/algorithm-complexity

作者

hb2cpc

发布于

2025年09月12日

许可协议