【数据结构】排序算法——Lesson2

🕗 发布于 2024-07-24 08:07 数据结构 排序算法算法

Hi~！这里是奋斗的小羊，很荣幸您能阅读我的文章，诚请评论指点，欢迎欢迎 ~~
💥💥个人主页：奋斗的小羊
💥💥所属专栏：C语言

🚀本系列文章为个人学习笔记，在这里撰写成文一为巩固知识，二为展示我的学习过程及理解。文笔、排版拙劣，望见谅。

前言

本文将继续介绍两种高效的排序算法——归并排序、计算排序。
归并排序在一些场合下（如外部排序）非常有效，当数据量非常大且无法全部加载到内存时，可以将其分块处理。
而计数排序是一种非比较排序算法，适用于特定范围内的整数排序，在许多数情况下计算排序可以秒杀我们介绍过的所有排序。

一、排序算法

1、归并排序

| 算法思路：

归并排序是建立在归并操作上的一种有效的排序算法，该算法是采用分治法的一个非常典型的应用，将已有序的子序列合并，得到完全有序的序列，即先使每个子序列有序，再使子序列间段有序。

在这里插入图片描述

动图演示：

请添加图片描述

代码实现：

//子函数
void _MergeSort(int* arr, int* tmp, int begin, int end)
{
if (begin == end)
{
return;
}
int mid = (begin + end) / 2;
//[begin, mid]  [mid + 1, end]
_MergeSort(arr, tmp, begin, mid);
_MergeSort(arr, tmp, mid + 1, end);

int begin1 = begin, end1 = mid;
int begin2 = mid + 1, end2 = end;
int i = begin;
while (begin1 <= end1 && begin2 <= end2)
{
if (arr[begin1] < arr[begin2])
{
tmp[i++] = arr[begin1++];
}
else
{
tmp[i++] = arr[begin2++];
}
}
while (begin1 <= end1)
{
tmp[i++] = arr[begin1++];
}
while (begin2 <= end2)
{
tmp[i++] = arr[begin2++];
}
memcpy(arr + begin, tmp + begin, (end - begin + 1) * sizeof(int));
}

//归并排序
void MergeSort(int* arr, int n)
{
int* tmp = (int*)malloc(n * sizeof(int));
if (tmp == NULL)
{
perror("malloc fail");
return;
}
_MergeSort(arr, tmp, 0, n - 1);

free(tmp);
tmp = NULL;
}

归并排序有几个需要特别注意的点：

分割区间一定要按[begin, mid] [mid + 1, end]分，不然会导致死循环
memcpy(arr + begin, tmp + begin, (end - begin + 1) * sizeof(int));
一定是归并一组拷贝一组，因为如果存在越界的情况还整体拷贝肯定会出错
归并排序算法的时间复杂度是：O(N*logN)，空间复杂度是：O(N).

2、归并非递归

递归改非递归有两种办法，一种是用栈模拟，一种是用循环处理。

上篇文章中快排非递归我们是利用栈实现的，但是归并的非递归使用栈解决不了，因为快排的递归过程是一个类似前序遍历的过程，而归并是一个类似后续的过程，它是先将区间循环分割成只有一个数据，再反向进行归并，栈是做不到这一点的。
所以归并的非递归我们考虑用循环来实现。

我们可以直接将原数组一一归并，再二二归并，再四四归并……

请添加图片描述

//归并非递归
void MergeSortNonR(int* arr, int n)
{
int* tmp = (int*)malloc(n * sizeof(int));
if (tmp == NULL)
{
perror("malloc fail");
return;
}

//gap是每组归并数据的个数
int gap = 1;
while (gap < n)
{
//i表示每组归并的起始位置
for (int i = 0; i < n; i += 2 * gap)
{
int begin1 = i, end1 = i + gap - 1;
int begin2 = i + gap, end2 = i + 2 * gap - 1;

int j = i;
while (begin1 <= end1 && begin2 <= end2)
{
if (arr[begin1] < arr[begin2])
{
tmp[j++] = arr[begin1++];
}
else
{
tmp[j++] = arr[begin2++];
}
}
while (begin1 <= end1)
{
tmp[j++] = arr[begin1++];
}
while (begin2 <= end2)
{
tmp[j++] = arr[begin2++];
}
//
memcpy(arr + i, tmp + i, (end2 - i + 1) * sizeof(int));
}
gap *= 2;//一一归，二二归，四四归
}

free(tmp);
tmp = NULL;
}

memcpy(arr + i, tmp + i, (end2 - i + 1) * sizeof(int));
for (int i = 0; i < n; i += 2 * gap)
int begin2 = i + gap, end2 = i + 2 * gap - 1;

但是上面的代码还不完善，仅限2的次方个数的数据归并，如果不是2的次方个数则会越界。越界无非下面三种情况：

[begin1, end1] [begin2, ~~end2~~ ]
[begin1, end1] [~~begin2~~ , ~~end2~~ ]
[begin1, ~~end1~~ ] [~~begin2~~ , ~~end2~~ ]

其中第二种和第三种可以归为一类，因为begin2越界说明我们需要排序的数据已经排好序了，越界的部分不是我们的区间我们根本不用管，直接退出循环就行了。
而第一种情况只需要处理一下就好，让end2变成n - 1就行了。

代码示例：

//归并非递归
void MergeSortNonR(int* arr, int n)
{
int* tmp = (int*)malloc(n * sizeof(int));
if (tmp == NULL)
{
perror("malloc fail");
return;
}

//gap是每组归并数据的个数
int gap = 1;
while (gap < n)
{
//i表示每组归并的起始位置
for (int i = 0; i < n; i += 2 * gap)
{
int begin1 = i, end1 = i + gap - 1;
int begin2 = i + gap, end2 = i + 2 * gap - 1;

//第二组都越界，不存在，不是我们需要排序的数据
if (begin2 >= n)
{
break;
}

//begin2没越界，end2越界，只需要修正一下就好
if (end2 >= n)
{
end2 = n - 1;
}

int j = i;
while (begin1 <= end1 && begin2 <= end2)
{
if (arr[begin1] < arr[begin2])
{
tmp[j++] = arr[begin1++];
}
else
{
tmp[j++] = arr[begin2++];
}
}
while (begin1 <= end1)
{
tmp[j++] = arr[begin1++];
}
while (begin2 <= end2)
{
tmp[j++] = arr[begin2++];
}
//归并一次拷贝一次
memcpy(arr + i, tmp + i, (end2 - i + 1) * sizeof(int));
}
gap *= 2;
}

free(tmp);
tmp = NULL;
}

3、计数排序

计数排序又称为鸽巢原理，是对哈希直接定址法的变形应用。其排序步骤为：

1. 统计相同元素出现的次数，将统计到的次数作为count数组以元素值对应下标处的值
2. 根据统计的结果将序列回收到原来的序列中
3. 动态开辟的count数组要初始化为全0

本质： 利用count数组的自然序号排序

为了保证开辟大小合适的count数组，我们可以用待排数据中最大值减最小值加一的方法来确定一个合适的范围（max - min + 1）。
然后再用元素值减去最小值的方法来和count数组形成相对映射关系（arr[i] - min），得到的值是几就在数组对应下标位置递增。
最后一步排序的时候不要忘了在原数组中插入的值还要加上最小值，并且count数组中下标对应位置的值是几就循环几次，如果对应位置是0的话说明原数组没有这个下标数，就不进入循环。

大致思想如下：

请添加图片描述

代码如下：

//计数排序
void CountSort(int* arr, int n)
{
int min = arr[0];
int max = arr[0];
for (int i = 1; i < n; i++)
{
if (arr[i] < arr[min])
{
min = arr[i];
}
if (arr[i] > arr[max])
{
max = arr[i];
}
}
int range = max - min + 1;
int* count = (int*)calloc(range, sizeof(int));
if (count == NULL)
{
perror("calloc fail");
return;
}
//统计次数
for (int i = 0; i < n; i++)//遍历原数组
{
count[arr[i] - min]++;
}
//排序
int j = 0;
for (int i = 0; i < range; i++)//遍历count数组
{
while (count[i]--)
{
arr[j++] = i + min;
}
}
free(count);
count = NULL;
}

计数排序的时间复杂度为：O(N + range)，相比较前几种排序算法，计数排序效率是非常高的，但速度快的同时也有空间消耗，计数排序的空间复杂度为：O(range)，所以计数排序也算是拿空间换时间。

计数排序虽然相对其他排序算法快且稳定，但也存在一些缺陷：

只能排整数，不能排浮点数
要求数据比较集中，不然空间开销太大

4、排序算法复杂度及稳定性分析

稳定性： 如果待排序数据中有多个相同的的数据，若经过排序这些相同的数据相对位置保持不变，则称这种排序算法是稳定的。

排序算法	时间复杂度	空间复杂度	稳定性
插入排序	O(N^2)	O(1)	稳定
希尔排序	O(N^1.3)	O(1)	不稳定
选择排序	O(N^2)	O(1)	`不稳定`
堆排序	O(N*logN)	O(1)	不稳定
冒泡排序	O(N^2)	O(1)	稳定
快速排序	O(N*logN)	`O(logN)`	不稳定
归并排序	O(N*logN)	O(N)	稳定
计数排序	O(N + range)	O(range)	稳定

总结

这些排序算法各有千秋，在某些特定的情况下某个算法的性能尤为突出，在一些复杂的排序中为了追求性能往往使用混合排序，这使得性能大大提高。

原文地址：https://blog.csdn.net/2301_78843337/article/details/140631231

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：pytest+allure
下一篇：记一次折腾后台nodejs服务的经历

sql server 查看io资源使用
如果输出physical reads 或者 read-ahead reads 大于0 ，则表示有物理读取。
阅读更多2024-11-14
opencv入门学习总结
import cv2 # 返回当前安装的 OpenCV 库的版本信息并且是字符串格式 print(cv2 . getVersionString()) """作用：它可以
阅读更多2024-11-14
stable-diffusion-3 ，每天免费试用
官方space，童叟无欺，科学试用。
阅读更多2024-11-14
AI绘画经验（stable-diffusion）
在Stable Diffusion中，编码器将图像压缩成一个较小的Latent特征向量，这个向量包含了图像的关键信息，并且可以作为U-Net的输入。在Stable Diffusion中，文本编码器用于
阅读更多2024-11-14
【Linux网络编程】Socket编程--TCP：echo server | 多线程远程命令执行
【Linux网络编程】Socket编程--TCP：echo server | 多线程远程命令执行
阅读更多2024-11-14
vLLM×Milvus：如何高效管理GPU内存，减少大模型幻觉
大语言模型（LLM）是功能丰富且强大的 AI 系统，能够解决各个领域内的众多问题。它们的发展速度非常快，新模型不断被频繁推出。通常，新推出的 LLM 在处理各种任务时的性能更好。例如 Mistral、
阅读更多2024-11-14
一个功能强大的文档解析和转换工具，支持PDF、DOCX、PPTX和Markdown等
Docling是一个功能强大的文档解析和转换工具，支持多种文档格式，提供先进的PDF理解功能，并允许用户将文档转换为Markdown和JSON格式。它还具有元数据提取、OCR支持、无缝集成以及其他高级
阅读更多2024-11-14
计算机网络：运输层 —— TCP 协议概述与 TCP 报文段首部格式
传输控制协议（Transmission Control Protocol，TCP）协议是互联网上最常用的传输层协议之一，它负责提供可靠的端到端数据传输服务。TCP 协议采用连接导向的通信方式，通过三次
阅读更多2024-11-14
MySQL常见面试题
MySQL常见面试题
阅读更多2024-11-14
《Redis 实战基础、持久化机制及与 MySQL 一致性解决方案》
本文探讨了Redis的持久化机制及其在不同场景下的应用，并简要介绍了与MySQL数据同步的一致性解决方案。希望这些内容能帮助读者更好地理解和使用Redis，提升应用系统的性能和可靠性。
阅读更多2024-11-14

【数据结构】排序算法——Lesson2

目录

前言

一、排序算法

1、归并排序

2、归并非递归

3、计数排序

4、排序算法复杂度及稳定性分析

总结

相关文章