目录
一、排序算法的概念:
二、排序算法的分类:
三、算法的时间复杂度
四、交换排序--冒泡排序
五、选择排序
六、插入排序
七、希尔排序--shell排序
八、快速排序--快排
九、归并排序
十、基数排序
一、排序算法的概念:
排序也称排序算法 (Sort Algorithm),排序是将一 组数据,依指定的顺序进行排列 的过程
二、排序算法的分类:
1) 内部排序: 指将需要处理的所有数据都加载 到内部存储器中进行排序。
2) 外部排序法: 数据量过大,无法全部加载到内 存中,需要借助外部存储进行 排序
三、算法的时间复杂度
时间频度:一个算法中的语句执行次数称为语句频度或时间频度。记为T(n)
时间复杂度:一般情况下,算法中的基本操作语句的重复执行次数是问题规模n的某个函数,用T(n)表示,若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n) / f(n) 的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数。记作 T(n)=O( f(n) ),称O( f(n) ) 为算法的渐进时间复杂度,简称时间复杂度。
T(n) 不同,但时间复杂度可能相同。 如:T(n)=n²+7n+6 与 T(n)=3n²+2n+2 它们的T(n) 不同,但时间复杂度相同,都为O(n²)。
常见的时间复杂度:
常数阶O(1)
对数阶O(log2n)【while循环】
线性阶O(n)【for循环】
线性对数阶O(nlog2n)【for循环嵌套while】
平方阶O(n^2)【双层for循环】
立方阶O(n^3)【三层for循环】
k次方阶O(n^k)
指数阶O(2^n)
常见的算法时间复杂度由小到大依次为:Ο(1)<Ο(log2n)<Ο(n)<Ο(nlog2n)<Ο(n2)<Ο(n3)< Ο(nk) <Ο(2n) ,随着问题规模n的不断增大,上述时间复杂度不断增大,算法的执行效率越低
排序算法的时间复杂度对比:
四、交换排序--冒泡排序
基本思想:通过对待排序的序列,从前完后依次比较相邻的值,逆序则进行交换,将小的值放到前面。
冒泡法总共进行 元素个数 -1 次冒泡,每次一冒泡可将一个数据放到正确的位置上
每次冒泡又进行 元素个数-1-i 次比较【i就是第几次冒泡】
代码实现:
使用冒泡法对80000个数据进行排序总耗时:10000ms左右
五、选择排序
基本思想:
第一次比较,假设数组一个中元素就是最小值【或者最大值】,将这个最小值与后面的元素进行比较,如果发现比假设最小值还要小,就进行交换。直到与后面的元素都比较完
第二次比较将第二个元素假设为最小值,与后面的元素一 一进行比较,还是和上面一样的操作
第三次比较....
.....
一共进行 元素个数 -1 次比较
图解:
代码实现:第一种写法
对80000个数据进行排序总耗时:8500ms左右
第二种写法:
对80000个数据进行排序总耗时:3500ms左右
六、插入排序
基本思想:
1、 将数组中的元素,看做俩部分,将数组中第一个元素看做是有序列表,其余的元素都是无序列表。
2、将无序列表中的元素与有序列表中最后一个元素进行比较,如果插入的元素比有序列表最后一个元素还大,就直接插入有序列表的最后面。
3、如果插入的元素比有序列表最后一个元素小,就将有序列表往前挪一位,与其进行比较,找到合适的位置插入
图解:
总共进行 元素个数 -1 次插入
代码实现:
对80000个数据进行排序总耗时:1000ms左右
★★★★★:对 index +1 进行一下解释:
拿上图第四次插入举例:[3 , 14, 17, 25] 20 , 9 插入20
1、将插入的值赋给minVal = 20 。
2、有序列表中最后一个元素是 25 ,下标是 3 ,index = 3
3、将 20 与 25 进行比较,发现 20 比 25 小,就将有序列表中最后一个元素向后复制一位
有序列表变成了 [3 , 14, 17, 25, 25] 20 , 9 index--,向前移动一位 index = 2 ,将 20 与 17 进行比较,发现 20 比 17 小,即将 20 插入 到 17 的后边 有序列表变成了:[3 , 14, 17, 20, 25] 9
七、希尔排序--shell排序
插入排序存在的问题:假设对数组 arr = {2,3,4,5,6,1} 进行排序,这时需要插入的数 1(最小), 这样的过程是: {2,3,4,5,6,6} {2,3,4,5,5,6} {2,3,4,4,5,6} {2,3,3,4,5,6} {2,2,3,4,5,6} {1,2,3,4,5,6}。仅仅是插入一个数据就需要 6 步,效率太低。所以使用希尔排序会提高速度
希尔排序是希尔(Donald Shell)于1959年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为缩小增量排序。
基本思想:
希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的元素越来越多,当增量减至1时,整个数组恰被分成一组,算法便终止
图解:
希尔排序第一种写法--交换法:【效率较低】
对80000个数据进行排序总耗时:5400ms左右
希尔排序第二种写法--插入法
对80000个数据进行排序总耗时:30ms左右
八、快速排序--快排
快速排序是对冒泡法的一种改进。通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列
快排思路:
1、定义俩个变量指针 left ,right。帮助进行数组遍历。left 指向数组最左边的元素,right 指向最右边的元素
2、将数组最左边的元素看做基准数 pivot【最右边或者中间都可以】,基准数左边的元素都比基准数小,基准数右边的元素都比基准数大。【把数组最左边元素看做基准数时,要从右边开始遍历,在从左边开始遍历。如果将右边元素看做基准数,则相反】
3、right 从右边开始遍历,当遇到比基准数小的值便会停下里。 left 从左边开始遍历,当遇到比基准数大的值便会停下来。当left,right都停下来的时候,交换俩个元素的位置。直到循环 左右指针重合的时候,停止交换。
4、当左右指针重合时,将 基准数pivot 和 重合位置的元素进行交换。
5、这个时候基准数左边就是比基准数小的元素,右边是比基准数大的元素了。完成了分割的俩部分
6、这时对左边进行递归操作,重复1、2、3、4、5步。对右边进行递归操作,重复1、2、3、4、5步
图解:
代码实现:
九、归并排序
归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治(divide-and-conquer)策略(分治法将问题分(divide)成一些小的问题然后递归求解,而治(conquer)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)。
图解:
分:将一组数据拆分成最小的序列,也就是一个元素一个序列
治:对有序的序列进行合并,最终得到一个有序的序列【核心操作】
再来看看治阶段,我们需要将两个已经有序的子序列合并成一个有序序列,比如上图中的最后一次合并,要将[4,5,7,8]和[1,2,3,6]两个已经有序的子序列,合并为最终序列[1,2,3,4,5,6,7,8],来看下实现步骤:
1、将左子序列和右子序列的每个值都进行比较,把较小的值放到temp集合中
2、最后将左子序列或者右子序列中剩余的元素,依次加入到temp集合中
3、将temp拷贝会原数组
代码实现:
对80000个数据进行排序总耗时:20ms左右
十、基数排序
基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是通过键值的各个位的值,将要排序的元素分配至某些“桶”中,达到排序的作用 基数排序法是属于稳定性的排序,基数排序法的是效率高的稳定性排序法 基数排序(Radix Sort)是桶排序的扩展
图解:
1、首先获取数组中最大的一个数,并求他的位数
2、创建一个二维数组表示桶子的数量10个以及每个桶子中的容量。并且用一个一位数组记录每个桶子中数据的个数
3、对数组中每个数据取到个位,并把每个数据放到对应的桶子中,每放入一个数据,桶子的数据个数+1
4、所有数据都放入后,判断每个桶子的容量是否为0,不为0将每个桶子的数据复制给原数组。【复制完后一定要将桶子中的个数清0】
5、取到每个数据的十位,百位....并完成上面的2、3、4步
代码实现:
对80000个数据进行排序时总耗时:30ms左右
使用基数排序时的注意事项:
1、基数排序是对传统桶排序的扩展,速度很快.
2、基数排序是经典的空间换时间的方式,占用内存很大, 当对海量数据排序时,容易造成 OutOfMemoryError 。
3、基数排序是稳定的。[注:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的]