热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

七种经典的排序算法

原文:http:wuchong.meblog20140209algorithm-sort-summary经典排序算法在面试中占有很大的比重,也是基础&

原文:http://wuchong.me/blog/2014/02/09/algorithm-sort-summary/

经典排序算法在面试中占有很大的比重,也是基础,为了未雨绸缪,在寒假里整理并用Python实现了七大经典排序算法,包括冒泡排序,插入排序,选择排序,希尔排序,归并排序,快速排序,堆排序。希望能帮助到有需要的同学。之所以用Python实现,主要是因为它更接近伪代码,能用更少的代码实现算法,更利于理解。

本篇博客所有排序实现均默认从小到大。

一、冒泡排序 BubbleSort

介绍:

冒泡排序的原理非常简单,它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。

步骤:

  1. 比较相邻的元素。如果第一个比第二个大,就交换他们两个。
  2. 对第0个到第n-1个数据做同样的工作。这时,最大的数就“浮”到了数组最后的位置上。
  3. 针对所有的元素重复以上的步骤,除了最后一个。
  4. 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。

源代码:(python实现)

1
2
3
4
5
6
7

def bubble_sort(arry):n = len(arry) #获得数组的长度for i in range(n):for j in range(1,n-i):if arry[j-1] > arry[j] : #如果前者比后者大arry[j-1],arry[j] = arry[j],arry[j-1] #则交换两者return arry

 

运行上面的代码有错误,
下面是自己写的,经过验证:
__author__ = 'xy'def bubble_sort(arry):n=len(arry)for i in range(n-1,0,-1):flag=1for j in range(0,i):if arry[j] > arry[j+1]:arry[j],arry[j+1] = arry[j+1],arry[j]flag=0if flag:breakreturn arryarry=[5,4,5,7,9,3,2,3,4]
print arry
bubble_sort(arry)
print arry

 

不过针对上述代码还有两种优化方案。

优化1:某一趟遍历如果没有数据交换,则说明已经排好序了,因此不用再进行迭代了。用一个标记记录这个状态即可。
优化2:记录某次遍历时最后发生数据交换的位置,这个位置之后的数据显然已经有序,不用再排序了。因此通过记录最后发生数据交换的位置就可以确定下次循环的范围了。

这两种优化方案的实现可以详见这里。

二、选择排序 SelectionSort

介绍:

选择排序无疑是最简单直观的排序。它的工作原理如下。

步骤:

  1. 在未排序序列中找到最小(大)元素,存放到排序序列的起始位置。
  2. 再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。
  3. 以此类推,直到所有元素均排序完毕。

源代码:(python实现)

1
2
3
4
5
6
7
8
9

def select_sort(ary):n = len(ary)for i in range(0,n):min = i #最小元素下标标记for j in range(i+1,n):if ary[j]

 

三、插入排序 InsertionSort

介绍:

插入排序的工作原理是,对于每个未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

步骤:

  1. 从第一个元素开始,该元素可以认为已经被排序
  2. 取出下一个元素,在已经排序的元素序列中从后向前扫描
  3. 如果被扫描的元素(已排序)大于新元素,将该元素后移一位
  4. 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置
  5. 将新元素插入到该位置后
  6. 重复步骤2~5

排序演示:

源代码:(python实现)

1
2
3
4
5
6
7
8
9
10
11
12
13
14

def insert_sort(ary):n = len(ary)for i in range(1,n):if ary[i] temp :ary[j+1] = ary[j]index = j #记录待插入下标else :breakary[index] = tempreturn ary

 

四、希尔排序 ShellSort

介绍:

希尔排序,也称递减增量排序算法,实质是分组插入排序。由 Donald Shell 于1959年提出。希尔排序是非稳定排序算法。

希尔排序的基本思想是:将数组列在一个表中并对列分别进行插入排序,重复这过程,不过每次用更长的列(步长更长了,列数更少了)来进行。最后整个表就只有一列了。将数组转换至表是为了更好地理解这算法,算法本身还是使用数组进行排序。

例如,假设有这样一组数[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ],如果我们以步长为5开始进行排序,我们可以通过将这列表放在有5列的表中来更好地描述算法,这样他们就应该看起来是这样:

13 14 94 33 82
25 59 94 65 23
45 27 73 25 39
10

然后我们对每列进行排序:

10 14 73 25 23
13 27 94 33 39
25 59 94 65 82
45

将上述四行数字,依序接在一起时我们得到:[ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ]。这时10已经移至正确位置了,然后再以3为步长进行排序:

10 14 73
25 23 13
27 94 33
39 25 59
94 65 82
45

排序之后变为:

10 14 13
25 23 33
27 25 59
39 65 73
45 94 82
94

最后以1步长进行排序(此时就是简单的插入排序了)。

源代码:(python实现)

1
2
3
4
5
6
7
8
9
10
11
12
13

def shell_sort(ary):n = len(ary)gap = round(n/2) #初始步长 , 用round四舍五入取整while gap > 0 :for i in range(gap,n): #每一列进行插入排序 , 从gap 到 n-1temp = ary[i]j = iwhile ( j >= gap and ary[j-gap] > temp ): #插入排序ary[j] = ary[j-gap]j = j - gapary[j] = tempgap = round(gap/2) #重新设置步长return ary

 

上面源码的步长的选择是从n/2开始,每次再减半,直至为0。步长的选择直接决定了希尔排序的复杂度。在维基百科上有对于步长串行的详细介绍。

五、归并排序 MergeSort

介绍:

归并排序是采用分治法的一个非常典型的应用。归并排序的思想就是先递分解数组,再并数组。

先考虑合并两个有序数组,基本思路是比较两个数组的最前面的数,谁小就先取谁,取了后相应的指针就往后移一位。然后再比较,直至一个数组为空,最后把另一个数组的剩余部分复制过来即可。

再考虑递归分解,基本思路是将数组分解成leftright,如果这两个数组内部数据是有序的,那么就可以用上面合并数组的方法将这两个数组合并排序。如何让这两个数组内部是有序的?可以再二分,直至分解出的小组只含有一个元素时为止,此时认为该小组内部已有序。然后合并排序相邻二个小组即可。

排序演示:

源代码:(python实现)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

def merge_sort(ary):if len(ary) <&#61; 1 : return arynum &#61; int(len(ary)/2) #二分分解left &#61; merge_sort(ary[:num])right &#61; merge_sort(ary[num:])return merge(left,right) #合并数组def merge(left,right):&#39;&#39;&#39;合并操作&#xff0c;将两个有序数组left[]和right[]合并成一个大的有序数组&#39;&#39;&#39;l,r &#61; 0,0 #left与right数组的下标指针result &#61; []while l

 

六、快速排序 QuickSort

介绍&#xff1a;
快速排序通常明显比同为Ο(n log n)的其他算法更快&#xff0c;因此常被采用&#xff0c;而且快排采用了分治法的思想&#xff0c;所以在很多笔试面试中能经常看到快排的影子。可见掌握快排的重要性。

步骤&#xff1a;

  1. 从数列中挑出一个元素作为基准数。
  2. 分区过程&#xff0c;将比基准数大的放到右边&#xff0c;小于或等于它的数都放到左边。
  3. 再对左右区间递归执行第二步&#xff0c;直至各区间只有一个数。

排序演示&#xff1a;

源代码&#xff1a;(python实现)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

def quick_sort(ary):return qsort(ary,0,len(ary)-1)def qsort(ary,left,right):#快排函数&#xff0c;ary为待排序数组&#xff0c;left为待排序的左边界&#xff0c;right为右边界if left >&#61; right : return arykey &#61; ary[left] #取最左边的为基准数lp &#61; left #左指针rp &#61; right #右指针while lp &#61; key and lp

 

七、堆排序 HeapSort

介绍&#xff1a;

堆排序在 top K 问题中使用比较频繁。堆排序是采用二叉堆的数据结构来实现的&#xff0c;虽然实质上还是一维数组。二叉堆是一个近似完全二叉树 。

二叉堆具有以下性质&#xff1a;

  1. 父节点的键值总是大于或等于&#xff08;小于或等于&#xff09;任何一个子节点的键值。
  2. 每个节点的左右子树都是一个二叉堆&#xff08;都是最大堆或最小堆&#xff09;。

步骤&#xff1a;

  1. 构造最大堆&#xff08;Build_Max_Heap&#xff09;&#xff1a;若数组下标范围为0~n&#xff0c;考虑到单独一个元素是大根堆&#xff0c;则从下标n/2开始的元素均为大根堆。于是只要从n/2-1开始&#xff0c;向前依次构造大根堆&#xff0c;这样就能保证&#xff0c;构造到某个节点时&#xff0c;它的左右子树都已经是大根堆。

  2. 堆排序&#xff08;HeapSort&#xff09;&#xff1a;由于堆是用数组模拟的。得到一个大根堆后&#xff0c;数组内部并不是有序的。因此需要将堆化数组有序化。思想是移除根节点&#xff0c;并做最大堆调整的递归运算。第一次将heap[0]heap[n-1]交换&#xff0c;再对heap[0...n-2]做最大堆调整。第二次将heap[0]heap[n-2]交换&#xff0c;再对heap[0...n-3]做最大堆调整。重复该操作直至heap[0]heap[1]交换。由于每次都是将最大的数并入到后面的有序区间&#xff0c;故操作完后整个数组就是有序的了。

  3. 最大堆调整&#xff08;Max_Heapify&#xff09;&#xff1a;该方法是提供给上述两个过程调用的。目的是将堆的末端子节点作调整&#xff0c;使得子节点永远小于父节点 。

排序演示&#xff1a;

源代码&#xff1a;(python实现)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

def heap_sort(ary) :n &#61; len(ary)first &#61; int(n/2-1) #最后一个非叶子节点for start in range(first,-1,-1) : #构造大根堆max_heapify(ary,start,n-1)for end in range(n-1,0,-1): #堆排&#xff0c;将大根堆转换成有序数组ary[end],ary[0] &#61; ary[0],ary[end]max_heapify(ary,0,end-1)return ary#最大堆调整&#xff1a;将堆的末端子节点作调整&#xff0c;使得子节点永远小于父节点
#start为当前需要调整最大堆的位置&#xff0c;end为调整边界
def max_heapify(ary,start,end):root &#61; startwhile True :child &#61; root*2 &#43;1 #调整节点的子节点if child > end : breakif child&#43;1 <&#61; end and ary[child]

 

总结

下面为七种经典排序算法指标对比情况&#xff1a;


推荐阅读
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 在Docker中,将主机目录挂载到容器中作为volume使用时,常常会遇到文件权限问题。这是因为容器内外的UID不同所导致的。本文介绍了解决这个问题的方法,包括使用gosu和suexec工具以及在Dockerfile中配置volume的权限。通过这些方法,可以避免在使用Docker时出现无写权限的情况。 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • 本文介绍了设计师伊振华受邀参与沈阳市智慧城市运行管理中心项目的整体设计,并以数字赋能和创新驱动高质量发展的理念,建设了集成、智慧、高效的一体化城市综合管理平台,促进了城市的数字化转型。该中心被称为当代城市的智能心脏,为沈阳市的智慧城市建设做出了重要贡献。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 本文介绍了Redis的基础数据结构string的应用场景,并以面试的形式进行问答讲解,帮助读者更好地理解和应用Redis。同时,描述了一位面试者的心理状态和面试官的行为。 ... [详细]
  • 本文介绍了使用Python根据字典中的值进行排序的方法,并给出了实验结果。通过将字典转化为记录项,可以按照字典中的值进行排序操作。实验结果显示,按照值进行排序后的记录项为[('b', 2), ('a', 3)]。 ... [详细]
  • 本文详细介绍了PHP中与URL处理相关的三个函数:http_build_query、parse_str和查询字符串的解析。通过示例和语法说明,讲解了这些函数的使用方法和作用,帮助读者更好地理解和应用。 ... [详细]
  • 本文介绍了如何在给定的有序字符序列中插入新字符,并保持序列的有序性。通过示例代码演示了插入过程,以及插入后的字符序列。 ... [详细]
  • 1,关于死锁的理解死锁,我们可以简单的理解为是两个线程同时使用同一资源,两个线程又得不到相应的资源而造成永无相互等待的情况。 2,模拟死锁背景介绍:我们创建一个朋友 ... [详细]
  • 解决Cydia数据库错误:could not open file /var/lib/dpkg/status 的方法
    本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件,以及ifunbox工具和终端命令,可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中,并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
author-avatar
CCTV知府影
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有