百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

常见的排序算法简介

toyiye 2024-06-21 12:02 10 浏览 0 评论

排序的稳定性

因为待排序的记录序列中可能存在两个或两个以上的关键字相等的记录, 排序结果可能会存在不唯一的情况。所以就有稳定与不稳定的定义。

假设ki=kj( 1 =< i <= n,1 =< j <= n, i != j),且在排序前的序列中ri领先于rj。如果排序后ri仍领先于rj,则称所用的排序方法是稳定的;反之,若可能使得排序后的序列中rj领先于ri,则称所用的排序方法是不稳定的。

只要有一组关键字发生类似情况,就可认为此排序方法是不稳定的。

内排序和外排序

根据在排序过程中待排序记录是否全部放在内存中,排序分为内排序和外排序。

内排序是在排序整个过程中,待排序的所有记录全部被放置在内存中。

外排序是由于排序的记录个数太多,不能同时放置在内存中,整个排序过程需要在内外存之间多次交换数据才能进行。

对内排序来说,排序算法的性能主要有3个影响因素:

1、时间性能

排序算法的时间开销是衡量其好坏的最重要的标志。

在内排序中,主要进行两种操作:比较和移动。

高效率的内排序算法应该具有尽可能少的关键字比较次数和尽可能少的记录移动次数。

2、辅助空间

评估算法的另一个主要标准是执行算法所需要的辅助存储空间。

辅助存储空间是除了存放待排序所占用的存储空间外,执行算法所需要的其他存储空间。

3、算法的复杂性

指算法本身的复杂性,过于复杂的算法也会影响排序的性能。

接下来本文介绍各种排序算法。

1. 冒泡排序Bubble Sort

冒泡排序是一种交换排序,它的基本思想是:

两两比较相邻记录的关键字,如果反序则交换,直到没有反序的记录为止。

算法复杂度分析:

使用优化后的冒泡排序,最好的情况下,仅需要n - 1次比较,时间复杂度为O(n);最坏情况下,需要n(n - 1)/2次比较和交换;

所以平均时间复杂度为O(n2)。

2. 简单选择排序Simple Selection Sort

选择排序的基本思想:

每一次遍历时选取关键字最小的记录作为有序序列的第i个记录。

算法复杂度分析

简单选择排序最大的特点就是交换移动数据次数少,但它的比较次数是和数组本身是否有序是无关的,即无论最好最差的情况,都要进行n(n-1)/2次比较;在最好的情况下,不需要进行交换,在最坏的情况下,进行n-1次交换。

所以平均时间复杂度为O(n2)。

3. 直接插入排序Straight Insertion Sort

直接插入排序的基本操作:

将一个记录插入到已经排好序的有序表中,从而得到一个新的、记录递增1的有序表。

插入排序是进行值移动,而是不值交换。所以在量较小的情况下插入排序性能要优于冒泡和简单选择排序。

算法复杂度分析:

在最好的情况下,只需进行比较n - 1次,无需进行移动;

在最坏的情况下,比较(n + 2)(n - 1)/2次,交换(n + 4)(n - 1)/2次。

所以平均时间复杂度O(n2)

4. 二分插入排序Binary Insert Sort

二分(折半)插入排序是一种在直接插入排序算法上进行小改动的排序算法。其与直接排序算法最大的区别在于查找插入位置时使用的是二分查找的方式,在速度上有一定提升。

算法复杂度分析:

插入每个记录需要O(log i)比较,最多移动i+1次,最少2次。最佳情况O(n log n),最差和平均情况O(n^2)。

总排序码比较次数比直接插入排序的最差情况好得多,但比最好情况要差,所元素初始序列已经按排序码接近有序时,直接插入排序比二分插入排序比较次数少

5. 希尔排序Shell Sort

希尔排序,也称递减增量排序算法,是插入排序的一种更高效的改进版本。希尔排序是非稳定排序算法。

希尔排序通过将比较的全部元素分为几个区域来提升插入排序的性能。这样可以让一个元素可以一次性地朝最终位置前进一大步。然后算法再取越来越小的步长进行排序,算法的最后一步就是普通的插入排序,但是到了这步,需排序的数据几乎是已排好的了。

更好的理解方式

将数组列在一个表中并对行排序(用插入排序)。重复这过程,不过每次用更小的列来进行。最后整个表就只有一列了。

将数组转换至表是为了更好地理解这算法,算法本身仅仅对原数组进行排序(通过增加索引的步长,例如是用i += step_size而不是i++)。

比如第一次放在5列中对每行使用快速排序排序,第二次放在3列中,最后放在1列中。类比于步长从5到3再到1。

算法复杂度分析

希尔排序的算法复杂度和增量序列有关,只要最终步长为1任何步长序列都可以工作。可以参加希尔排序。

6. 堆排序Heap Sort

堆是具有下列性质的完全二叉树:

每个节点的值都大于或等于其左右孩子节点的值,成为大顶堆;

每个节点的值都小于或等于其左右孩子节点的值,成为小顶堆;

完全二叉树性质

按完全二叉树的性质,该树可以被顺序存储在数组中,按不同的角标进行表示。

即:

Parent(i) = (i-1)/2,i 的父节点下标

Left(i) = 2i + 1,i 的左子节点下标

Right(i) = 2(i + 1),i 的右子节点下标

基本思想

将待排序的序列构造成一个大顶堆。此时,整个序列的最大值就是堆定的根节点,将它移走(与堆数组末尾元素交换),再将剩余n-1个序列重新构造成一个堆,这样就会得到第二大值,以此类推,就能得到一个有序序列了。

算法复杂度分析

在构建堆时,对每个非叶子节点来说,最多进行2次比较和互换操作,复杂度为O(n);

在进行排序时,第i次取堆顶记录重新建堆需要用O(log i )时间,并需要取n-1次,所以重建堆的时间为O(nlogn)。

所以堆排序的时间复杂度为O(nlogn)。

实现步骤:

最大堆调整(Max_Heapify):从堆的倒数第一个非叶子节点作调整,使得子节点永远小于父节点。没有必要从叶子节点开始,叶子节点可以看作是已符合堆特点的节点。

创建最大堆(Build_Max_Heap):将堆所有数据重新排序

堆排序(HeapSort):移除位在第一个数据的根节点,并做最大堆调整。

7. 归并排序Merge Sort

概念:

归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法的典型应用。

它指的是将两个已经排序的序列合并成一个序列的操作。归并排序算法依赖归并操作。归并排序有多路归并排序、两路归并排序 , 可用于内排序,也可以用于外排序。这里仅对内排序的两路归并方法进行讨论。

算法思路

把 n 个记录看成 n 个长度为 l 的有序子表

进行两两归并使记录关键字有序,得到 n/2 个长度为 2 的有序子表

重复第 2 步直到所有记录归并成一个长度为 n 的有序表为止。

算法复杂度分析:

在最后一步,需要依次遍历两个已排序的好的数组,此时的时间复杂度为O(n)。

同时又进行着二路归并,形成一颗完全二叉树,此时整个排序需要进行log2n次。

所以归并排序的时间复杂度为O(nlogn)。这是它的最好、最坏、平均的时间性能。

8. 快速排序Quick Sort

基本思想

通过一趟排序将待排序记录分割成独立的两部分,其中一部分记录的关键字均比另一部分小,则可分别对这两部分记录继续进行排序,直到整个序列有序。

复杂度分析

最好情况:partition每次划分的都很均匀,如果排序n个关键字,其递归树的深度就为floor(log2n)+ 1次,此时的复杂度为O(nlogn)。

如果是最坏情况,每次partition都只操作一个数字,该递归树即为一颗斜树,比较次数为n(n - 1)/2,时间复杂度为O(n2)。

平均复杂度为O(nlogn)。

9. 桶排序Bucket Sort

基本思想

工作的原理是将数组分到有限数量的桶里。每个桶再个别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行排序)。

步骤

设置一个定量的数组当作空桶子。

寻访序列,并且把项目一个一个放到对应的桶子去。

对每个不是空的桶子进行排序。

从不是空的桶子里把项目再放回原来的序列中。

算法复杂度

对于N个待排数据,M个桶,平均每个桶[N/M]个数据的桶排序平均时间复杂度为:

O(N)+O(M*(N/M)log(N/M))=O(N+N(logN-logM))=O(N+N*logN-N*logM)

可以看出,最好情况即当N=M时,每个桶只有一个数据时,能够达到O(N)。

10. 计数排序Count Sort

基本思想

计数排序是一种稳定的线性时间排序算法。

计数排序使用一个额外的数组C,其中C数组的第i个元素是待排序数组A中值等于i的元素的个数。然后根据数组C来将A中的元素排到正确的位置。

步骤:

找出待排序的数组中最大和最小的元素

统计数组中每个值为i的元素出现的次数,存入数组 C 的第 i 项

对所有的计数累加(从C中的第一个元素开始,每一项和前一项相加)

反向填充目标数组:将每个元素i放在新数组的第C(i)项,每放一个元素就将C(i)减去1

算法复杂度分析

当输入的元素是n个0到k之间的整数时,它的运行时间是Θ(n + k)。计数排序不是比较排序,排序的速度快于任何比较排序算法。

由于用来计数的数组C的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上1),这使得计数排序对于数据范围很大的数组,需要大量时间和内存。

西安尚学堂 http://www.xasxt.com/

Java零基础就业班

上课地址:陕西省西安市高新区科技二路西安软件园天泽大厦五楼

咨询电话:029-62258374 QQ 2145598324

招生对象:

1. 零计算机编程基础学

2. 对行业不满意人士

3. 跨专业编程爱好者

4. 在校大学生实训

Java零基础班,10年 Java 以上开发经验技术讲师、架构师、行业大牛,亲自纯面授课程,手把手教你写编程。

10月新班免费试听课程已就绪,7天免费听课,体验Java乐趣。

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码