Python 排序算法

平均速度最快的排序算法是?

排序方法 平均情况 最好情况 最坏情况 辅助空间 稳定性
冒泡排序 O(n^2) O(n) O(n^2) O(1) 稳定
选择排序 O(n^2) O(n^2) O(n^2) O(1) 不稳定
插入排序 O(n^2) O(n) O(n^2) O(1) 稳定
希尔排序 O(n*log(n))~O(n^2) O(n^1.3) O(n^2) O(1) 不稳定
堆排序 O(n*log(n)) O(n*log(n)) O(n*log(n)) O(1) 不稳定
归并排序 O(n*log(n)) O(n*log(n)) O(n*log(n)) O(n) 稳定
快速排序 O(n*log(n)) O(n*log(n)) O(n^2) O(1) 不稳定
基数排序 O(n+r) O(n+r) O(n+r) O(n+r) 稳定

冒泡排序经过优化以后,最好时间复杂度可以达到O(n)。设置一个标志位,如果有一趟比较中没有发生任何交换,可提前结束,因此在正序情况下,时间复杂度为O(n)。

选择排序在最坏和最好情况下,都必须在剩余的序列中选择最小(大)的数,与已排好序的序列后一个位置元素做交换,依次最好和最坏时间复杂度均为O(n^2)。

插入排序是在把已排好序的序列的后一个元素插入到前面已排好序(需要选择合适的位置)的序列中,在正序情况下时间复杂度为O(n)。

堆是完全二叉树,因此树的深度一定是log(n)+1,最好和最坏时间复杂度均为O(n*log(n))。

归并排序是将大数组分为两个小数组,依次递归,相当于二叉树,深度为log(n)+1,因此最好和最坏时间复杂度都是O(n*log(n))。

快速排序在正序或逆序情况下,每次划分只得到比上一次划分少一个记录的子序列,用递归树画出来,是一棵斜树,此时需要n-1次递归,且第i次划分要经过n-i次关键字比较才能找到第i个记录,因此时间复杂度是\sum_{i=1}^{n-1}(n-i)=n(n-1)/2,即O(n^2)。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
def radix_sort(lists):
"""
基数排序
基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是透过键值的部份资讯,
将要排序的元素分配至某些“桶”中,藉以达到排序的作用,基数排序法是属于稳定性的排序,其时间复杂度为O (nlog(r)m),
其中r为所采取的基数,而m为堆数,在某些时候,基数排序法的效率高于其它的稳定性排序法。
"""
radix = 10
# log() 方法返回x的自然对数,x > 0
# ceil(x) 函数返回一个大于或等于 x 的的最小整数。
k = math.ceil(math.log(max(lists)+1, radix))
bucket = [[] for i in range(radix)]
for i in range(1, k+1):
for j in lists:
bucket[int(j/(radix**(i-1)) % (radix**i))].append(j)
del lists[:]
for z in bucket:
lists += z
del z[:]
return lists
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
def merge_sort(lists):
"""
归并排序(利用递归)
归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;
即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
归并过程为:比较a[i]和a[j]的大小,若a[i]≤a[j],则将第一个有序表中的元素a[i]复制到r[k]中,并令i和k分别加上1;否则将第二个有序表中的元素a[j]复制到r[k]中,
并令j和k分别加上1,如此循环下去,直到其中一个有序表取完,然后再将另一个有序表中剩余的元素复制到r中从下标k到下标t的单元。归并排序的算法我们通常用递归实现,
先把待排序区间[s,t]以中点二分,接着把左边子区间排序,再把右边子区间排序,最后把左区间和右区间用一次归并操作合并成有序的区间[s,t]。
"""
def merge(lts, rts):
"""
合并过程
"""
i, j = 0, 0
result = []
while i < len(lts) and j < len(rts):
if lts[i] <= rts[j]:
result.append(lts[i])
i += 1
else:
result.append(rts[j])
j += 1
return result + lts[i:] + rts[j:]
count = len(lists)
if count < 2:
return lists
m = count // 2
lts = merge_sort(lists[:m])
rts = merge_sort(lists[m:])
return merge(lts, rts)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39

def heap_sort(lists):
"""
堆排序(较难理解)
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。可以利用数组的特点快速定位指定索引的元素。
堆分为大根堆和小根堆,是完全二叉树。大根堆的要求是每个节点的值都不大于其父节点的值,即A[PARENT[i]] >= A[i]。
在数组的非降序排序中,需要使用的就是大根堆,因为根据大根堆的要求可知,最大的值一定在堆顶。
"""
def adjust_heap(lists, count, i):
"""
调整堆
"""
lc = 2 * i + 1
rc = 2 * i + 2
tag = i

if lc < count and lists[tag] < lists[lc]:
tag = lc
if rc < count and lists[tag] < lists[rc]:
tag = rc
if tag != i:
lists[tag], lists[i] = lists[i], lists[tag]
adjust_heap(lists, count, tag)
pass

def build_heap(lists, count):
"""
堆化
叶子节点只能和自己比较,直接从非叶子节点 n/2 ~ 1 开始堆化
"""
for i in range(count//2)[::-1]:
adjust_heap(lists, count, i)
pass

count = len(lists)
build_heap(lists, count)
for i in range(count-1, 0, -1):
lists[0], lists[i] = lists[i], lists[0]
adjust_heap(lists, i, 0)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
def shell_sort(lists):
"""
希尔排序
希尔排序(Shell Sort)是插入排序的一种。也称缩小增量排序,是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。
该方法因DL.Shell于1959年提出而得名。 希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,
每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。
"""
n = len(lists)
# 初始步长
gap = n // 2
while gap > 0:
for i in range(gap, n):
# 每个步长進行插入排序
temp = lists[i]
j = i
# 插入排序
while j >= gap and lists[j - gap] > temp:
lists[j] = lists[j - gap]
j -= gap
lists[j] = temp
# 得到新的步长
gap = gap // 2
return list
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

def quick_sort(lists):
"""
快速排序(利用递归,较难理解)
通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,
然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列
"""
def partition(lists, start, end):
pivot, j = lists[start], start
for i in range(start+1, end):
if lists[i] <= pivot:
j += 1
lists[j], lists[i] = lists[i], lists[j]
lists[start], lists[j] = lists[j], lists[start]
return j

def quick_sort_t(lists, start, end):
if start < end:
# k = random.randint(start, end-1)
# lists[k], lists[start] = lists[start], lists[k]
m = partition(lists, start, end)
quick_sort_t(lists, start, m)
quick_sort_t(lists, m+1, end)
quick_sort_t(lists, 0, len(lists))
return lists
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
def select_sort(lists):
"""
选择排序
基本思想:第1趟,在待排序记录r1 ~ r[n]中选出最小的记录,将它与r1交换;第2趟,在待排序记录r2 ~ r[n]中选出最小的记录,将它与r2交换;
以此类推,第i趟在待排序记录r[i] ~ r[n]中选出最小的记录,将它与r[i]交换,使有序序列不断增长直到全部排序完毕。
"""
count = len(lists)
for i in range(count):
min_index = i
for j in range(i + 1, count):
if lists[min_index] > lists[j]:
min_index = j
if min_index != i:
lists[min_index], lists[i] = lists[i], lists[min_index]
return lists
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
def insert_sort(lists):
"""
插入排序
插入排序的基本操作就是将一个数据插入到已经排好序的有序数据中,从而得到一个新的、个数加一的有序数据,算法适用于少量数据的排序,时间复杂度为O(n^2)。
是稳定的排序方法。插入算法把要排序的数组分成两部分:第一部分包含了这个数组的所有元素,但将最后一个元素除外(让数组多一个空间才有插入的位置),
而第二部分就只包含这一个元素(即待插入元素)。在第一部分排序完成后,再将这个最后元素插入到已排好序的第一部分中
"""
count = len(lists)
for j in range(1, count):
value = lists[j]
i = j - 1
while i >= 0 and lists[i] > value:
lists[i+1] = lists[i]
i -= 1
lists[i + 1] = value
return lists
1
2
3
4
5
6
7
8
9
10
11
12
def bubble_sort(lists):
"""
冒泡排序
它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。
走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。
"""
count = len(lists)
for i in range(count):
for j in range(i+1, count):
if lists[i] > lists[j]:
lists[i], lists[j] = lists[j], lists[i]
return lists