假定有两个算法,都能实现相同功能(算法均正确),那么如何判断这两个算法孰优孰劣?
可通过分析算法的时间复杂度来判断:
分析算法的时间复杂度。算法的时间复杂度反映了程序执行时间随输入规模增长而增长的量级,在很大程度上能很好反映出算法的优劣与否。因此,作为程序员,掌握基本的算法时间复杂度分析方法是很有必要的。
我们通常衡量一个算法跑的快不快,对代码的优化结果如何,采用的最简单最粗暴方法就是加一个计时器(即代码实际运行时间)。
例如,优化前计算一下运行时间,优化后计算一下运行时间,通过比较两次前后的时间,就可以判断出来算法的粗略的时间复杂度。
但是该方法有两个很大的缺陷:
一个用高级语言编写的程序在计算机上运行时所消耗的时间取决于下列因素:[1]
(1). 算法采用的策略、方法;(2). 编译产生的代码质量;(3). 问题的输入规模;(4). 机器执行指令的速度。
一个算法是由控制结构(顺序、分支和循环3种)和原操作(指固有数据类型的操作)构成的,则算法时间取决于两者的综合效果。为了便于比较同一个问题的不同算法,通常的做法是,从算法中选取一种对于所研究的问题(或算法类型)来说是基本操作的原操作,以该基本操作的重复执行的次数作为算法的时间量度。
(1) ** 时间频度** 一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。但我们不可能也没有必要对每个算法都上机测试,只需知道哪个算法花费的时间多,哪个算法花费的时间少就可以了。并且一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为T(n)。
(2) 时间复杂度 在刚才提到的时间频度中,n称为问题的规模,当n不断变化时,时间频度T(n)也会不断变化。但有时我们想知道它变化时呈现什么规律。为此,我们引入时间复杂度概念。 一般情况下,算法中基本操作重复执行的次数是问题规模n的某个函数,用T(n)表示,若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n)/f(n)的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数。记作T(n)=O(f(n)),称O(f(n)) 为算法的渐进时间复杂度,简称时间复杂度。
Landau符号:O
Landau符号的作用在于用简单的函数来描述复杂函数行为,给出一个上或下(确)界。
T (n) = Ο(f (n)) 表示存在一个常数C,使得在当n趋于正无穷时总有 T (n) ≤ C * f(n)。简单来说,就是T(n)在n趋于正无穷时最大也就跟f(n)差不多大。虽然对f(n)没有规定,但是一般都是取尽可能简单的函数。
例如,O(2n2+n+1)=O(3n2+n+3)=O(7n2+n)=O(n2)O(2n^2+n +1) = O (3n^2+n+3) = O (7n^2 + n) = O ( n^2 )O(2n2+n+1)=O(3n2+n+3)=O(7n2+n)=O(n2) ,一般都只用O(n2)O(n^2)O(n2)表示就可以了。即只关心主干,其它都不管。
在各种不同算法中,若算法中语句执行次数为一个常数,则时间复杂度为O(1)。Ο(1)表示基本语句的执行次数是一个常数,一般来说,只要算法中不存在循环语句,其时间复杂度就是Ο(1)
常见的复杂度有:
常数阶O(1),对数阶O(log2n),线性阶O(n),线性对数阶O(nlog2n),平方阶O(n2),立方阶O(n3),...,k次方阶O(nk),指数阶O(2n)。随着问题规模n的不断增大,上述时间复杂度不断增大,算法的执行效率越低。常数阶O(1),对数阶O(\log_2n),线性阶O(n), 线性对数阶O(n\log_2n),平方阶O(n^2),立方阶O(n^3),..., k次方阶O(n^k),指数阶O(2^n)。随着问题规模n的不断增大,上述时间复杂度不断增大,算法的执行效率越低。常数阶O(1),对数阶O(log2n),线性阶O(n),线性对数阶O(nlog2n),平方阶O(n2),立方阶O(n3),...,k次方阶O(nk),指数阶O(2n)。随着问题规模n的不断增大,上述时间复杂度不断增大,算法的执行效率越低。
常见的算法时间复杂度由小到大依次为:
O(1)<O(log2n)<O(n)<O(nlog2n)<O(n2)<O(n3)<…<O(2n)<O(n!)Ο(1)<Ο(\log_2n)<Ο(n)<Ο(n\log_2n)<Ο(n^2)<Ο(n^3)<…<Ο(2^n)<Ο(n!)O(1)<O(log2n)<O(n)<O(nlog2n)<O(n2)<O(n3)<…<O(2n)<O(n!)
其中O(log2n)、O(n)、O(nlog2n)、O(n2)、O(n3)Ο(\log_2n)、Ο(n)、Ο(n\log_2n)、Ο(n^2)、Ο(n^3)O(log2n)、O(n)、O(nlog2n)、O(n2)、O(n3)称为多项式时间,而O(2n)Ο(2^n)O(2n)和O(n!)Ο(n!)O(n!)称为指数时间。计算机科学家普遍认为前者(即多项式时间复杂度的算法)是有效算法,把这类问题称为P(Polynomial,多项式)类问题,而把后者(即指数时间复杂度的算法)称为NP(Non-Deterministic Polynomial, 非确定多项式)问题。
如果算法中包含嵌套的循环,则基本语句通常是最内层的循环体,如果算法中包含并列的循环,则将并列循环的时间复杂度相加。
例如:计算如下的时间复杂度
for (i=1; i<=n; i++)x++; #时间复杂度O(n)for (i=1; i<=n; i++)for (j=1; j<=n; j++)x++; #时间复杂度O(n^2)
则整个算法时间复杂度为O(n+n2)=O(n2)O(n+n^2)=O(n^2)O(n+n2)=O(n2)
1).对于一些简单的输入输出语句或赋值语句,近似认为需要O(1)时间
(2).对于顺序结构,需要依次执行一系列语句所用的时间可采用大O下"求和法则"
求和法则:是指若算法的2个部分时间复杂度分别为 T1(n)=O(f(n))和 T2(n)=O(g(n)),则 T1(n)+T2(n)=O(max(f(n), g(n)))
特别地,若T1(m)=O(f(m)), T2(n)=O(g(n)),则 T1(m)+T2(n)=O(f(m) + g(n))
(3).对于选择结构,如if语句,它的主要时间耗费是在执行then字句或else字句所用的时间,需注意的是检验条件也需要O(1)时间
(4).对于循环结构,循环语句的运行时间主要体现在多次迭代中执行循环体以及检验循环条件的时间耗费,一般可用大O下"乘法法则"
乘法法则: 是指若算法的2个部分时间复杂度分别为 T1(n)=O(f(n))和 T2(n)=O(g(n)),则 T1*T2=O(f(n)*g(n))
(5).对于复杂的算法,可以将它分成几个容易估算的部分,然后利用求和法则和乘法法则技术整个算法的时间复杂度
主要参考算法的时间复杂度和空间复杂度-总结