排序算法中,冒泡
、插入
、选择
属于相类似的排序算法,这类算法的共同点:通过不停地比较,再使用交换逻辑重新确定数据的位置。
希尔
、归并
、快速
排序算法也可归为同一类,它们的共同点都是建立在分治思想之上。把大问题分拆成小问题,解决所有小问题后,再合并每一个小问题的结果,最终得到对原始问题的解答。
Tips: 通俗而言:化整为零,各个击破。
分治算法很有哲学蕴味:老祖宗所言 合久必分,分久必合,分开地目的是为了更好的合并。
分治算法的求解流程:
分解问题:将一个需要解决的、看起很复杂 原始问题
分拆成很多独立的**子问题
**,子问题
与原始问题
有相似性。
求解子问题:子问题除了与原始问题具有相似性,也具有独立性,即所有子问题都可以独立求解。
合并子问题: 合并每一个子问题的求解结果最终可以得到原始问题的解。
下面通过深入了解希尔排序算法
,看看分治算法
是如何以哲学之美的方式工作的。
讲解希尔之前,先要回顾一下插入排序。插入排序的平均时间复杂度,理论上而言和冒泡排序是一样的 O(n
2)
,但如果数列是前部分有序,则每一轮只需比较一次,对于 n
个数字的原始数列而言,时间复杂度可以达到 O(n)
。
插入排序的时间复杂度为什么会出现如此有意思的变化?
3
倍。这便是插入排序的性能有可能要优于冒泡排序的原因。希尔排序算法本质就是插入排序,或说是对插入排序的改良。
希尔算法的理念:让原始数列不断趋近于排序,从而降低插入排序的时间复杂度。当数列局部有序时,全局必然是趋向于有序。
希尔排序的实现流程:
希尔排序的关键在于如何切分子数列,切分方式可以有 2
种:
如有原始数列=[3,9,8,1,6,5,7]
,采用前后分可分成如下图所示的 2
个子数列。
然后对前、后部分的数列使用插入算法排序。
如上图所示,子数列排序后,要实现原始数列的最终有序,则后部分的数字差不多全部要以超车的方式,插入到前部分数字的中间,交换量较大。
理想的状态是数字整体有序,需要交换的次数不多。所以前后分这种一根筋的切分方式,对于原始问题的最终性能优化起不了太多影响。
增量切分采用间隔切分方案,可能让数字局部有序以正态分布。
增量切分,需要先设定一个增量值。如对原始数列=[3,9,8,1,6,5,7]
设置切分增量为 3
时,整个数列会被切分成 3
个逻辑子数列。增量数也决定最后能切分多少个子数列。
对切分后的 3
个子数列排序后可得到下图。
下面两张图是增量切分前后数字位置的变化图,可以看出来,几乎所有的数字都产生了位置变化 ,且位置变化的跨度较大。如数字 9
原始位置是 1
,经过增量切分再排序后位置可以到 4
,已经很接近 9
的最终位置 6
了。有整体趋于有序的势头,在此基础之上,再进行插入排序的的次数要少很多。
实现希尔排序算法时,最佳的方案是先初始化一个增量值,切分排序后再减少增量值,如此反复直到增量值等于 1
(也就是对原数列整体做插入排序)。
Tips: 增量值大,数字位置变化的跨度就大,增量值小,数字位置的变化会收紧。
编码实现希尔排序:
#include
using namespace std;
// 插入排序
void insertSort(int nums[],int size, int start,int increment) {
//后指针指向原数列的第 2 个数字,所以索引号从 1 开始
for(int backIdx=start + increment; backIdx
int frontIdx = backIdx;
while(frontIdx>=0 && nums[frontIdx]
int tmp=nums[frontIdx];
nums[frontIdx]=nums[frontIdx-increment];
nums[frontIdx-increment]=tmp;
}
}
}
// 希尔排序
void shellSort(int nums[],int size) {
// 增量
int increment=size/2;
// 新数列
while (increment > 0) {
// 增量值是多少,则切分的子数列就有多少
for(int start=0; start
}
// 修改增量值,直到增量值为 1
increment = increment / 2;
}
}
int main(int argc, char** argv) {
int nums[] = {3, 9, 8, 1, 6, 5, 7};
int size=sizeof(nums)/4;
shellSort(nums,size);
for(int i=0; i
return 0;
}
这里会有一个让人疑惑的观点:难道一次插入排序的时间复杂度会高于多次插入排序时间复杂度?
通过切分方案,经过子数列的微排序(因子数列数字不多,其移动交换量也不会很大),最后一次插入排序只需要在几个数字之间微调,甚至不需要。只要增量选择合适,时间复杂度可以控制 在 O(n)
到 O(n2)之间。完全是有可能优于单纯的使用一次插入排序。
归并排序算法也是基于分治思想。和希尔排序一样,需要对原始数列进行切分,但是切分的方案不一样。
相比较希尔排序,归并排序的分解子问题,求解子问题,合并子问题的过程分界线非常清晰。可以说,归并排序更能完美诠释什么是分治思想。
归并排序算法的分解过程采用二分方案。
把原始数列一分为二。
然后在已经切分后的子数列上又进行二分。
如此反复,直到子数列不能再分为止。
如下图所示:
如下代码,使用递归算法对原数列进行切分,通过输出结果观察切分过程:
#include
using namespace std;
// 切分原数列
void splitNums(int nums[],int start,int end ) {
int size=end-start;
for(int i=start; i
// 切分线,中间位置
int spLine = size / 2;
splitNums(nums,start,spLine+start);
splitNums(nums,spLine+start,end );
}
}
int main(int argc, char** argv) {
int nums[] = {3, 9, 8, 1, 6, 5, 7};
int size=sizeof(nums)/4;
splitNums(nums,0,size);
return 0;
}
输出结果: 和上面演示图的结论一样。
因为已经切分到了原子性,可认为子数列是有序的。然后对相邻2
个子数列进行合并,合并后要保证数字依然有序。
如何实现 2
个有序子数列合并后依然有序?
使用首数字比较算法进行合并排序。如下图演示了如何合并 nums01=[1,3,8,9]、nums02=[5,6,7]
2
个子数列。
1
和 数字 5
比较,5
大于 1
,数字 1
先位于合并数列中。3
与数字 5
比较,数字 3 先进入合并数列中。8
和数字 5
比较,数字 5
进入合并数列中。前面是分步讲解切分和合并逻辑,现在把切分和合并逻辑合二为一,完成归并算法的实现。
#include
using namespace std;
int nums_[] = {3, 9, 8, 1, 6, 5, 7};
// 切分原数列
void splitNums(int nums[],int start,int end ) {
int size=end-start;
if (size>1) {
// 切分线,中间位置
int spLine = size / 2;
//前子数组的绝对大小
int s1=spLine;
//后子数组的绝对大小
int s2=end-spLine-start;
//前面的子数组
int nums01[s1];
int idx=0;
//切分原数组,注意相对位置
for(int i=start; i
idx++;
}
int nums02[s2];
idx=0;
for(int i=spLine+start; i
idx++;
}
splitNums(nums01,start,spLine+start);
splitNums(nums02,spLine+start,end );
// 为 2 个数列创建 2 个指针
int idx_01 = 0;
int idx_02 = 0;
int k = 0;
while (idx_01
// 合并后的数字要保存到原数列中
nums[k] = nums02[idx_02];
idx_02 += 1;
} else {
nums[k] = nums01[idx_01];
idx_01 += 1;
}
k += 1;
}
// 检查是否全部合并
while (idx_02
idx_02 += 1;
k += 1 ;
}
while (idx_01
idx_01 += 1;
k += 1;
}
}
}
int main(int argc, char** argv) {
int size=sizeof(nums_)/4;
splitNums(nums_,0,size);
cout<<"归交排序&#xff1a;"<
return 0;
}
输出结果&#xff1a;
从归并算法上可以完整的看到分治理念的哲学之美。
基数排序&#xff08;radix sort&#xff09;
属于“分配式排序”&#xff08;distribution sort&#xff09;
&#xff0c;又称“桶子法”&#xff08;bucket sort&#xff09;
或 bin sort
。
Tips&#xff1a; 基数排序没有使用分治理念&#xff0c;放在本文一起讲解&#xff0c;是因为基数排序有一个对数字自身切分逻辑。
基数排序的最基本思想&#xff1a;
如对原始数列 nums &#61; [3, 9, 8, 1, 6, 5, 7]
中的数字使用基数排序。
先提供一个长度为 10
的新空数列&#xff08;本文也称为排序数列&#xff09;。
Tips&#xff1a; 为什么新空数列的长度要设置为 10&#xff1f;等排序完毕&#xff0c;相信大家就能找到答案。
。把原数列中的数字转存到新空数列中&#xff0c;转存方案&#xff1a;
nums
中的数字 3
存储在新数列索引号为 3
的位置。
nums
中的数字 9
存储在新数列索引号为 9
的位置。
nums
中的数字 8
存储在新数列索引号为 8
的位置。
……
从上图可知&#xff0c;原数列中的数字所转存到排序数列中的位置&#xff0c;是数字所代表的索引号所指的位置。显然&#xff0c;经过转存后&#xff0c;新数列就是一个排好序的数列。
编码实现&#xff1a;
#include
using namespace std;
int main(int argc, char** argv) {
// 原数列
int nums[] &#61; {3, 9, 8, 1, 6, 5, 7};
int size&#61;sizeof(nums)/4;
// 找到数列中的最大值
int maxVal&#61;nums[0];
for(int i&#61;1; i
maxVal&#61;nums[i];
}
int sortNums[maxVal&#43;1]&#61; {0};
for (int i : nums) {
sortNums[i]&#61;i;
}
for (int i : sortNums) {
if(i!&#61;0)
cout< }
return 0;
}
上述排序的缺点&#xff1a;
如对 nums&#61;[1,98,51,2,32,4,99,13,45]
使用上述方案排序&#xff0c;新空数列的长度要达到 99
&#xff0c;真正需要保存的数字只有 7
个&#xff0c;如此空间浪费几乎是令人恐怖的。
所以&#xff0c;有必要使用改良方案。如果在需要排序的数字中出现了 2
位以上的数字&#xff0c;则使用如下法则&#xff1a;
1
存储在位置为 1
的位置&#xff0c;是 9
就存储在位置是 9
的位置。如下图&#xff1a;
可看到有可能在同一个位置保存多个数字。这也是基数排序也称为桶子法的原因。
Tips&#xff1a; 一个位置就是一个桶&#xff0c;可以存放多个具有相同性质的数字。如上图&#xff1a;个位上数字相同的数字就在一个桶中。
nums&#61;[1&#xff0c;51&#xff0c;2&#xff0c;32&#xff0c;13&#xff0c;4&#xff0c;45&#xff0c;8&#xff0c;99]
可以看到&#xff0c;经过 2
轮转存后&#xff0c;原数列就已经排好序。
Tips&#xff1a; 这个道理是很好理解的&#xff1a;现实生活中&#xff0c;我们在比较
2
个数字 大小时&#xff0c;可以先从个位上的数字相比较&#xff0c;然后再对十位上的数字比较。如此&#xff0c;无论是多少位的数字&#xff0c;都可以运用基数排序算法。
基数排序&#xff0c;很有生活的味道&#xff01;&#xff01;
编码实现基数排序&#xff1a; 下面代码使用递归实现。
#include
#include
using namespace std;
//排序用数组
int sortNums[10][10]&#61; {0};
void baseSort(int nums[],int size,int start,int depth) {
if(start&#61;&#61;depth) {
return;
}
//取位
for(int i&#61;0; i
int temp&#61;nums[i] / wei % 10;
for(int j&#61;0; j<10; j&#43;&#43;) {
if( sortNums[temp][j]&#61;&#61;0 ) {
sortNums[temp][j]&#61;nums[i] ;
break;
}
}
}
//取出排序的数据
int idx&#61;0;
for(int row&#61;0; row<10; row&#43;&#43;) {
for(int col&#61;0; col<10; col&#43;&#43;) {
if( sortNums[row][col]!&#61;0 ) {
nums[idx]&#61;sortNums[row][col];
sortNums[row][col]&#61;0;
idx&#43;&#43;;
}
}
}
//递归
baseSort(nums,size,start&#43;1,depth);
}
int main(int argc, char** argv) {
// 原数列
int nums[] &#61; {1, 98, 51, 2, 32, 114, 99, 13, 45};
int size&#61;sizeof(nums)/4;
int bakNums[size];
for(int i&#61;0; i
}
//找到最大值
int maxVal&#61;nums[0];
for(int i&#61;1; i
maxVal&#61;nums[i];
}
}
//计算最大值的位数
string str&#61; to_string(maxVal);
int depth&#61;str.size();
//基数排序
baseSort(nums,size,0,depth);
for(int i&#61;0; i
return 0;
}
输出结果&#xff1a;
上述转存过程是由低位到高位&#xff0c;也称为 LSD
&#xff0c;也可以先高位后低位方案转存MSD
。
分治很有哲学味道&#xff0c;当你遇到困难&#xff0c;应该试着找到问题的薄弱点&#xff0c;然后一点点地突破。
当遇到困难时&#xff0c;老师们总会这么劝解我们。分治其实和项目开发中的组件设计思想也具有同工异曲之处。