快速选择算法--无序数组中寻找中位数 O(n)的算法及证明

🕗 发布于 2024-09-28 04:41 算法排序算法 数据结构

一、排序算法

排序的算法是最容易想到的，但是即使是快排，平均复杂度也只有 $\log n)$ 。

#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;

double findMid(vector<int>& nums) {
    int n = nums.size();
    sort(nums.begin(), nums.end());
    if (n % 2) {
        return nums[n/2];
    }
    else {
        return (nums[n/2] + nums[n/2-1]) / 2.0;
    }
}


int main() {
    vector<int> nums = {9, 8, 7, 6, 1, 2, 3, 4};
    cout << findMid(nums) << endl;
    return 0;
}

这就很简单，没什么说的了，只需要注意如果数组为偶数需要求两个数的平均值

二、快速选择算法

1、随机选择一个元素作为基准

2、将数组分为三个部分，小于基准，等于基准，大于基准

3、确定位置：

如果基准的位置恰好是中位数位置，那么返回基准
如果中位数在小于基准位置，那么递归处理小于部分
如果中位数在大于基准位置，那么递归处理大于部分

#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;

int quickselect(vector<int> nums, int l, int r, int k) {
    if (l == r) return nums[l];

    // 元素选择为最右边元素
    int pivot_value = nums[r];

    int j = l;
    for (int i=l; i<r; i++) {
        if (nums[i] < pivot_value) {
            swap(nums[i], nums[j]);
            ++j;
        }
    }
    // 基准元素放回数组中间
    swap(nums[r], nums[j]);

    if (k == j) {
        return nums[k];
    }
    else if (k < j) {
        return quickselect(nums, l, j-1, k);
    } 
    else {
        return quickselect(nums, j+1, r, k);
    }
    

}

double findMid(vector<int>& nums) {
    int n = nums.size();
    if (n % 2) {
        // cout << '$' << endl;
        return quickselect(nums, 0, n-1, n/2);
    }
    else {
        int a = quickselect(nums, 0, n-1, n/2);
        int b = quickselect(nums, 0, n-1, n/2-1);
        // cout << a << ' ' << b << endl;
        return (a + b) / 2.0;
    }
}


int main() {
    vector<int> nums = {9, 8, 7, 6, 1, 2, 3, 4};
    cout << findMid(nums) << endl;
    return 0;
}

快速选择算法有点类似于快速排序，可以帮助我们快速找到数组中的第k个元素。但是快速排序的时间复杂度是 $\log n)$ 为什么快速选择算法就是 $O (n)$ 呢？

2.1、期望时间复杂度

期望分析：

假设基准将数组分为 $an$ 和 $(1 - a) n$ 两部分，其中 $a$ 是一个介于 0 和 1 之间的常数。
每次递归调用后的时间复杂度可以表示为： $T (n) = T (α n) + O (n)$
这里， $O (n)$ 是当前分区所需的时间。

递归展开：

我们可以展开这个递归公式：

$T(n)=O(n)+T(an)=O(n) + O(n^2) + T(a^2n) = ... = O(n) + O(n^2) + ...+O(a^k n)$

其中k是递归深度，直到n变为1。

求和公式：

求和部分是一个几何级数：

$O(n^2) + ...+O(a^k n) = O(n)(1+a+a^2+...+a^k) = \frac{1-a^k}{1-a} O(n)$

最终结果：

因此，整体的时间复杂度可以表示为： $O (n)$

2.2、最差时间复杂度

最差时间复杂度就可以看做每一层选择的值都很差，都需要和剩下的n-1个值比较
$T(n-2)O(n-1)O(n)=...=O(\frac{n(n-1)}{2}) = O(n^2)$

原文地址：https://blog.csdn.net/weixin_43903639/article/details/142598223

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Meta Llama 3.2发布：小型文本模型与多模态视觉能力，AI的未来已来！
下一篇：成为谷歌开发者专家（GDE）的经历

Python与C#关于switch的使用区别
在习惯C#编程后，在多种解析情况下，都使用到了switch case，可以输入不同的值，来执行不同的操作或者定义。在最近使用过程中，接触到python，发现没有自带的switch case语句，记录一
阅读更多2024-09-28
网易云多久更新一次ip属地
‌在数字化时代，网络成为了我们日常生活中不可或缺的一部分。无论是社交娱乐还是工作学习，IP地址作为网络身份的象征，都扮演着重要的角色。对于网易云音乐这样的热门应用来说，IP属地的显示不仅关乎用户体验，
阅读更多2024-09-28
风扇模块（直流5V STM32）
直流风扇(Fan)，具有高转速、大风量、低噪音、低能耗和低震动的特点，有DC5V和12V两种型号可供选择。尺寸包括40~120mm不等。内部包含含油轴承，减少摩擦降低风噪。以下是风扇模块的参数：型号4
阅读更多2024-09-28
【幂简集成】手机归属地查询API，精准获取号码所在地，提升数据准确率
幂简集成（Explinks.com）发现，手机号归属地查询 api是一种基于互联网的服务，通过提供手机号，可以查询到该号码的归属地信息。归属地通常包括国家、省份、城市等详细地理信息。这类手机号归属地查
阅读更多2024-09-28
对 LLM 工具使用进行统一
尽管还留了一点小尾巴，但我们认为相比以前，情况已经有了很大的改进，之前的工具调用方式分散、混乱且记录不足。我们希望我们为统一作的努力可以让开源开发人员更轻松地在他们的项目中使用工具，以通过一系列令人惊
阅读更多2024-09-28
解决GitHub下载速度慢
【代码】解决GitHub下载速度慢。
阅读更多2024-09-28
基于SpringBoot的学生宿舍管理系统【附源码】
学生宿舍管理系统集中管理信息，有着保密性强，效率高，存储空间大，成本低等诸多优点。它可以降低信息管理成本，实现信息管理计算机化。
阅读更多2024-09-28
Linux云计算 |【第四阶段】RDBMS1-DAY2
常用函数（函数分类1：单行、分组；函数分类2：字符、数学、日期、流程控制）、分组查询group by、连接查询
阅读更多2024-09-28
【JavaScript】搭建一个具有记忆的简洁个人待办网页
简约方便带记忆的个人待办网页
阅读更多2024-09-28
赋值运算符重载
在进行代码调试时，发现赋值操作未成功，导致代码逻辑异常，经过分析，发现QVector3D 赋值重载函数存在问题，返回一个临时对象，从而导致赋值失败。如果类中涉及动态内存管理，返回一个新的对象可能会导致
阅读更多2024-09-28

快速选择算法--无序数组中寻找中位数 O(n)的算法及证明

一、排序算法

二、快速选择算法

2.1、期望时间复杂度

2.2、最差时间复杂度

相关文章