
🌇个人主页:_麦麦_
📚今日名言:繁华落尽,我心中仍有花落的声音。一朵,一朵,在无人的山间轻轻飘落。——席慕蓉《桐花》

目录
在本篇文章中,将会为小伙伴们详细的讲解“归并排序”。不过说到这里,有的小伙伴可能就会说了标题中不是还有“计数排序”嘛,这到底是什么呢?其实在前文中我们所展现的关于排序的思维导图是属于比较排序的,而除了比较排序之外,另一类排序就是非比较排序。而计数排序恰恰是非比较排序中一类相对常见的排序,所以也拿出来向小伙伴们介绍啦!
那么比较排序和非比较排序的区别在什么地方呢?顾名思义,比较排序需要对元素进行比较从而得出符合预期的排序,而非比较排序则无须对元素进行比较就能够得到预期的排序。至于如何实现归并排序和计数排序,那么就好好往下看叭!
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有 序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
简单来说,就是相比于直接让一个无序的序列变得有序,合并两个有序的序列要更为简单一些,因此我们就可以逐渐细分,将一个无序的序列分为两个序列,使这两个序列有序后再进行合并。但是这两个序列要如何有序呢,再将这两个序列分为四个序列,使这四个序列有序后,再进行合并……直至分解后的序列无法进行再分解,这时的序列中就只有一个元素了,与其余序列比较以及后面的合并也最为简单,这也是递归版的归并排序的大致思路。
下面就分别用动态图和分解图来帮助小伙伴们更好的理解叭!


那么这种思路体现在代码中,该如何实现呢。接下来我们就来讲讲递归版归并排序的代码思路。
在代码的书写中,大致分为两个模块,第一步是”归”,将大序列不断细分成两个小序列,第二个则是“并”,将小序列排好序后再将其合并。
那么具体该如何做呢?
在“归”这一步中,我们可以将这个序列不断对半分开,可以不是严谨的对半,由于我们本文是对数组进行归并排序,因此只需要将数组首元素和末尾元素的下标相加除以2即可作为分隔序列的边界。那么不断切分到什么时候为止呢?相信小伙伴们很容易答出当这个序列只有一个元素的时候就无须再切分了,因为此时它已经是“有序”了。
在“并”这一步中,大致有两步。首先是让两个序列有序,然后就是将两个有序序列合并。我们先来讲讲合并这一步,在两个序列已经有序的前提下,我们只需对两个序列从头一一比较即可,以升序为例,当序列一的首元素较小时,我们就将该元素取出,反之则取出序列而的元素,接下来重复以上操作即可,最后当两个序列的元素全部取出后,我们就会发现这个由两个序列的元素组成的新序列也是有序的。不过这都是建立要合并的两个序列是有序的前提下,那么要如何做到呢。其实是很简单的,由于我们将序列不断切分至只有一个元素,那么此时的序列就是有序的,而这些最小单位的序列合并后由上面可以知道定然也是有序了呀,这也就是归并排序的奥妙所在。
下面我们就以升序的代码为例:
//归并排序[递归]
void _MergeSort(int* arr, int begin, int end, int* tmp)
{
//区间只有一个元素
if (begin == end)
return;
int mid = (begin + end)/2;
//左区间归并
_MergeSort(arr, begin,mid, tmp);
//右区间归并
_MergeSort(arr, mid+1, end, tmp);
//排序
int begin1=begin;
int end1 = mid;
int begin2 = mid+1;
int end2 = end;
int i = begin;
while (begin1 <= end1 && begin2 <= end2)
{
if (arr[begin1] < arr[begin2])
tmp[i++] = arr[begin1++];
else
tmp[i++] = arr[begin2++];
}
while(begin1 <= end1)
tmp[i++] = arr[begin1++];
while (begin2 <= end2)
tmp[i++] = arr[begin2++];
//拷贝
memcpy(&arr[begin], &tmp[begin], sizeof(int) * (end-begin+1));
}
void MergeSort(int* arr, int n)
{
//申请一个数组用于归并排序
int* tmp = (int*)malloc(sizeof(int) * n);
if (tmp == NULL)
{
perror("malloc failed");
}
//排序
_MergeSort(arr, 0, n-1, tmp);
//释放
free(tmp);
tmp = NULL;
}
不过对于一名合格的程序猿来说,自然还要掌握排序的非递归版,因为当递归的深度太深的时候,程序就有可能无法正常运行,因此也就有了非递归版的归并排序。
在理解完递归版的归并排序之后,再来看看非递归其实就很简单了。我们会发现归并排序无非就是就是将大序列切分成一个个小序列再将小序列排好序后合并即可,因此我们是否可以采用循环的方式来实现呢,答案当然是肯定的啦。
不过在具体的代码实现上,小伙伴们的写法在一个地方可能会有所不同,就是拷贝数组的数组的时候,是将所有的相同长度的序列排好序后并合并后的拷贝到原数组上,用方言来说就是“梭哈”,还是当一对相同长度的序列排好序且合并后就马上拷贝到原数组。其实本质上两者并无本质区别,只是在对数组的边界判断会有所不同而已。
具体代码如下:
//归并排序[非递归梭哈版]
void MergeSortNonR1(int* arr, int n)
{
//申请一个数组用于归并排序
int* tmp = (int*)malloc(sizeof(int) * n);
if (tmp == NULL)
{
perror("malloc failed");
}
//排序
int gap = 1;
//所有相同长度的序列的归并
while (gap < n)
{
int i = 0;
int j = 0;
//一对序列的归并
for (i = 0; i < n; i += 2 * gap)
{
//划分边界
int begin1 = i;
int end1 = i + gap - 1;
int begin2 = i + gap;
int end2 = i + 2 * gap - 1;
//边界判断
if (end1 > n - 1 || begin2 > n - 1)
{
break;
}
if (end2 > n - 1)
{
end2 = n - 1;
}
while (begin1 <= end1 && begin2 <= end2)
{
if (arr[begin1] < arr[begin2])
tmp[j++] = arr[begin1++];
else
tmp[j++] = arr[begin2++];
}
while (begin1 <= end1)
tmp[j++] = arr[begin1++];
while (begin2 <= end2)
tmp[j++] = arr[begin2++];
memcpy(&arr[i], &tmp[i], sizeof(int) * gap);
//增大序列长度
gap *= 2;
}
}
}
//归并排序[非递归非梭哈版]
void MergeSortNonR2(int* arr, int n)
{
//申请一个数组用于归并排序
int* tmp = (int*)malloc(sizeof(int) * n);
if (tmp == NULL)
{
perror("malloc failed");
}
//排序
int gap = 1;
//所有相同长度的序列的归并
while (gap < n)
{
int i = 0;
int j = 0;
//一对序列的归并
for (i = 0; i < n; i += 2 * gap)
{
//划分边界
int begin1 = i;
int end1 = i + gap - 1;
int begin2 = i + gap;
int end2 = i + 2 * gap - 1;
//边界判断
if (end1 > n - 1)
{
end1 = n - 1;
begin2 = n;
end2 = n - 1;
}
if (begin2 > n - 1)
{
begin2 = n;
end2 = n - 1;
}
if (end2 > n - 1)
{
end2 = n - 1;
}
while (begin1 <= end1 && begin2 <= end2)
{
if (arr[begin1] < arr[begin2])
tmp[j++] = arr[begin1++];
else
tmp[j++] = arr[begin2++];
}
while (begin1 <= end1)
tmp[j++] = arr[begin1++];
while (begin2 <= end2)
tmp[j++] = arr[begin2++];
}
memcpy(arr, tmp, sizeof(int) * n);
//增大序列长度
gap *= 2;
}
}
①归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。
② 时间复杂度:O(N*logN)
③ 空间复杂度:O(N)
④ 稳定性:稳定
计数排序的基本思想是对于给定的输入序列中的每一个元素x,确定该序列中值小于x的元素的个数(此处并非比较各元素的大小,而是通过对元素值的计数和计数值的累加来确定)。一旦有了这个信息,就可以将x直接存放到最终的输出序列的正确位置上。
例如,如果输入序列中只有17个元素的值小于x的值,则x可以直接存放在输出序列的第18个位置上。当然,如果有多个元素具有相同的值时,我们不能将这些元素放在输出序列的同一个位置上,因此,上述方案还要作适当的修改
通俗来说,就是通过计算序列中每个元素所出现的个数,就能过将这些元素按照我们的需求处于正确的位置,听起来是不会很神奇呀,那就接着往下看叭!
在了解完计数排序的基本思路后,那么到底该如何实现呢,那么就不卖关子啦。
首先我们需要额外创立一个数组来记录序列中每个元素所出现次数。那么创立之后,随之而来的就是这个数组要开多大呢?这就涉及到两种计数方式了,分别是绝对位置映射计数,而另一种就是相对位置映射计数。
对于绝对位置映射计数来说,序列的元素所出现的次数就存储在新数组以记录元素为下标的位置,比如说数字“3”出现了4次,那么我们就在新数组的下标为3的位置修改为4,表明数字“3”在序列中出现了4次。不过这种方式还是存在很大的弊端的,就是当这一串序列的数字并不连续集中的时候,数组就会有很多的元素为0,既浪费时间也浪费空间,因此就衍生出了相对位置映射计数。也就是我们代码实现所采用的方式。
对于相对位置映射计数,我们需要遍历序列,找到序列中的最大值和最小值,依据两者的差值来确定的数组的大小,而序列中的元素减去最小值后便可作为新数组的下标来存储出现的次数,是谓相对位置。
具体代码如下:
//计数排序
void CountSort(int* arr, int n)
{
//找出数组中最大数和最小数
int i = 0;
int max = arr[0];
int min = arr[0];
for (i = 0; i < n; i++)
{
if (arr[i] > max)
max = arr[i];
if (arr[i] < min)
min = arr[i];
}
int sz = max - min + 1;
//申请一个数组
int* a = (int*)malloc(sizeof(int) * sz);
if (a == NULL)
{
perror("malloc failed");
}
memset(a, 0, sizeof(int) * sz);
//记录元素出现的次数
for (i = 0; i < n; i++)
{
a[arr[i] - min]++;
}
//对数组进行排序
int num = 0;
for(i=0;i<sz;i++)
{
while (a[i]--)
{
arr[num++] =i+min;
}
}
}
① 计数排序在数据范围集中时,效率很高,但是适用范围及场景有限。
② 时间复杂度:O(MAX(N,范围))
③空间复杂度:O(范围)
④ 稳定性:稳定
到此为止,关于归并排序和计数排序的讲解就告一段落了,而其他的排序也会在下面的文章中继续讲解,敬请期待呀!
关注我 _麦麦_分享更多干货:_麦麦_的博客_CSDN博客-领域博主
大家的「关注❤️ + 点赞👍 + 收藏⭐」就是我创作的最大动力!谢谢大家的支持,我们下期见!
我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳
尝试在我的RoR应用程序中实现计数器缓存列时出现错误Unknownkey(s):counter_cache。我在这个问题中实现了模型关联:Modelassociationquestion这是我的迁移:classAddVideoVotesCountToVideos0Video.reset_column_informationVideo.find(:all).eachdo|p|p.update_attributes:videos_votes_count,p.video_votes.lengthendenddefself.downremove_column:videos,:video_vot
我正在尝试按0-9和a-z的顺序创建数字和字母列表。我有一组值value_array=['0','1','2','3','4','5','6','7','8','9','a','b','光盘','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','','u','v','w','x','y','z']和一个组合列表的数组,按顺序,这些数字可以产生x个字符,比方说三个list_array=[]和一个当前字母和数字组合的数组(在将它插入列表数组之前我会把它变成一个字符串,]current_combo['0','0','0']
给定一个复杂的对象层次结构,幸运的是它不包含循环引用,我如何实现支持各种格式的序列化?我不是来讨论实际实现的。相反,我正在寻找可能会派上用场的设计模式提示。更准确地说:我正在使用Ruby,我想解析XML和JSON数据以构建复杂的对象层次结构。此外,应该可以将该层次结构序列化为JSON、XML和可能的HTML。我可以为此使用Builder模式吗?在任何提到的情况下,我都有某种结构化数据-无论是在内存中还是文本中-我想用它来构建其他东西。我认为将序列化逻辑与实际业务逻辑分开会很好,这样我以后就可以轻松支持多种XML格式。 最佳答案 我最
我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_
无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD
本教程将在Unity3D中混合Optitrack与数据手套的数据流,在人体运动的基础上,添加双手手指部分的运动。双手手背的角度仍由Optitrack提供,数据手套提供双手手指的角度。 01 客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照:https://gitee.com/foheart_1/foheart-h1-data-summary.git02 数据转发打开MotiveBody软件的Streaming,开始向Unity3D广播数据;MotionVenus中设置->选项选择Unit
文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目,Java开发。基于数据库增量日志解析,提供增量数据订阅&消费。Git地址:https://github.co