排序算法

来自testwiki
跳转到导航 跳转到搜索

Template:Unreferenced Template:NoteTA計算機科學數學中,一個排序算法Template:Lang-en)是一種能將一串資料依照特定排序方式排列的算法。最常用到的排序方式是數值順序以及字典順序。有效的排序算法在一些算法(例如搜尋算法Template:Le)中是重要的,如此這些算法才能得到正確解答。排序算法也用在處理文字資料以及產生人類可讀的輸出結果。基本上,排序算法的輸出必須遵守下列兩個原則:

  1. 輸出結果為遞增序列(遞增是針對所需的排序順序而言)
  2. 輸出結果是原輸入的一種排列、或是重組

雖然排序算法是一個簡單的問題,但是從計算機科學發展以來,在此問題上已經有大量的研究。舉例而言,泡沫排序在1956年就已經被研究。雖然大部分人認為這是一個已經被解決的問題,有用的新算法仍在不斷的被發明。(例子:圖書館排序在2004年被發表)

分類

计算机科学所使用的排序算法通常依以下標準分類:

  • 計算的時間複雜度(最差、平均、和最好-{zh-cn:性能; zh-tw:表現;}-),依據串列(list)的大小(n)。一般而言,好的-{zh-cn:性能; zh-tw:表現;}-是O(nlogn)大O符号),壞的-{zh-cn:性能; zh-tw:表現;}-是O(n2)。對於一個排序理想的-{zh-cn:性能; zh-tw:表現;}-是O(n),但平均而言不可能達到。基於比較的排序算法對大多數輸入而言至少需要O(nlogn)
  • -{zh-cn:内存; zh-tw:記憶體;}-使用量(以及其他電腦資源的使用)
  • 穩定性:穩定排序算法會讓原本有相等鍵值的紀錄維持相對次序。也就是如果一個排序算法是穩定的,當有兩個相等鍵值的紀錄RS,且在原本的串列中R出現在S之前,在排序過的串列中R也將會是在S之前。
  • 排序的方法:插入、交換、選擇、合併等等。

穩定性

稳定排序纸牌的例子。当纸牌用稳定排序按点值排序的时候,两个5之间必定保持它们最初的次序。在用不稳定排序来排序的时候,两个5可能被按相反次序来排序。

當相等的元素是無法分辨的,比如像是整數,穩定性並不是一個問題。然而,假設以下的數對將要以他們的第一個數字來排序。

(4,1)(3,1)(3,7)(5,6)

在這個狀況下,有可能產生兩種不同的結果,一個是讓相等鍵值的紀錄維持相對的次序,而另外一個則沒有:

(3,1)(3,7)(4,1)(5,6) (維持次序)
(3,7)(3,1)(4,1)(5,6) (次序被改變)

不穩定排序算法可能會在相等的鍵值中改變紀錄的相對次序,但是穩定排序算法從來不會如此。不穩定排序算法可以被特別地實作為穩定。作這件事情的一個方式是人工擴充鍵值的比較,如此在其他方面相同鍵值的兩個物件間之比較,(比如上面的比较中加入第二个标准:第二个键值的大小)就會被決定使用在原先資料次序中的條目,當作一個同分決賽。然而,要記住這種次序通常牽涉到額外的空間負擔。

排序算法列-{}-表

在這個表格中,n是要被排序的紀錄數量以及k是不同鍵值的數量。

穩定的排序

  • 冒泡排序(bubble sort)— O(n2)
  • 插入排序(insertion sort)—O(n2)
  • 鸡尾酒排序(cocktail sort)—O(n2)
  • 桶排序(bucket sort)—O(n);需要O(k)額外空間
  • 计数排序(counting sort)—O(n+k);需要O(n+k)額外空間
  • 归并排序(merge sort)—O(nlogn);需要O(n)額外空間
  • 原地归并排序O(nlog2n)如果使用最佳的現在版本
  • 二叉排序树排序(binary tree sort)— O(nlogn)期望时间;O(n2)最坏时间;需要O(n)額外空間
  • 鸽巢排序(pigeonhole sort)—O(n+k);需要O(k)額外空間
  • 基數排序(radix sort)—O(nk);需要O(n)額外空間
  • 侏儒排序(gnome sort)— O(n2)
  • 圖書館排序(library sort)— O(nlogn)期望时间;O(n2)最坏时间;需要(1+ε)n額外空間
  • Template:Tsl(block sort)— O(nlogn)
  • Tim排序(Timsort)—O(nlogn)平均、最坏时间;O(n)最优时间;需要O(n)額外空間;是目前已知最快的排序算法,在Python、Swift、Rust等语言的内置排序功能中被用作默认算法

不穩定的排序

不實用的排序

  • Bogo排序O(n×n!),最壞的情況下期望時間為無窮。
  • Stupid排序O(n3);遞迴版本需要O(n2)額外記憶體
  • 珠排序(bead sort)— O(n)O(n),但需要特別的硬體
  • 煎餅排序O(n),但需要特別的硬體
  • 臭皮匠排序(stooge sort)算法简单,但需要约n2.7的时间

简要比较

名称 数据对象 稳定性 时间复杂度 額外空间复杂度 描述
平均 最坏
冒泡排序 数组 Template:Y O(n2) O(1) (无序区,有序区)。
從无序区透過交換找出最大元素放到有序区前端。
选择排序 数组 Template:N O(n2) O(1) (有序区,无序区)。
在无序区里找一个最小的元素跟在有序区的后面。对数组:比较得多,换得少。
链表 Template:Y
插入排序 数组、链表 Template:Y O(n2) O(1) (有序区,无序区)。
把无序区的第一个元素插入到有序区的合适的位置。对数组:比较得少,换得多。
堆排序 数组 Template:N O(nlogn) O(1) (最大堆,有序区)。
从堆顶把根卸出来放在有序区之前,再恢复堆。
归并排序 数组 Template:Y O(nlog2n) O(1) 把数据分为两段,从两段中逐个选最小的元素移入新数据段的末尾。
可从上到下或从下到上进行。
O(nlogn) O(n)+O(logn)
如果不是从下到上
链表 O(1)
快速排序 数组 Template:N O(nlogn) O(n2) O(logn) (小数,基准元素,大数)。
在区间中随机挑选一个元素作基准,将小于基准的元素放在基准之前,大于基准的元素放在基准之后,再分别对小数区与大数区进行排序。
链表 Template:Y
希爾排序 数组 Template:N O(nlog2n) O(n2) O(1) 每一輪按照事先決定的間隔進行插入排序,間隔會依次縮小,最後一次一定要是1。
计数排序 数组、链表 Template:Y O(n+m) O(n+m) 统计小于等于该元素值的元素的个数i,于是该元素就放在目标数组的索引i位(i≥0)。
桶排序 数组、链表 Template:Y O(n) O(n2) O(m) 将值为i的元素放入i号桶,最后依次把桶里的元素倒出来。
基数排序 数组、链表 Template:Y O(k×n) O(n2) 一种多关键字的排序算法,可用桶排序实现。
  • 均按从小到大排列
  • k代表数值中的"数位"个数
  • n代表数据规模
  • m代表数据的最大值减最小值

参考文献

Template:Reflist

外部链接

Template:- Template:排序算法表 Template:算法