Pythonの手書きでテン古典的なソートアルゴリズム

アルゴリズムをソートする最も基本的で、アルゴリズムの一つ、「データ構造とアルゴリズム」です。

 

ソートソートアルゴリズムは、データをソートし、内部および外部の並べ替え、メモリ内のソート内部ソートレコードのデータに分け、しかし大きいため、外部ソートすることができ、一つはすべてのレコードがアクセス外部メモリへのソート処理のニーズにソートに対応することはできません。一般的な内部ソートアルゴリズム:挿入ソート、シェルソート、選択ソート、バブルソート、マージソート、クイックソート、ヒープソート、基数ソートなど。絵の概要と:

 

 

時間計算について:

  1. 広場の順序(O(N2))簡単なソートのすべての種類の注文:インライン、直接選択とバブルソートを。

  2. リニアソートクイックソート(O(nlog2n))の順、ヒープソートとマージソート。

  3. O(N1 +§))ソート、§0と1の間の定数の間です。シェルソート

  4. ボックスをソート線形順序バケットに加えて、(O(n))を基数ソート順序、、。

 

安定性について:

 

  • 順序付けシーケンスと同じ2つのキーが等しいソートされる前に、

  • 安定ソートアルゴリズム:バブルソート、挿入ソート、マージソートと基数ソート。

  • アルゴリズムを並べ替えていない安定した:選択ソート、クイックソート、シェルソート、ヒープソート。

 

用語集:

 

N:データサイズk:インプレースの数の「バケット」:一定のメモリを占有し、追加メモリアウトの場所を占有することなく:余分なメモリを使用しています

 

1、バブルソート

 

バブルソート(バブルソート)それはまた、シンプルで直感的なソートアルゴリズムです。彼らは切り替え間違った順序でそれらを置く場合は繰り返し、列の数ソートする、二つの要素の比較を訪問しました。列の数はすでに完了してソートと言うことですスワップにはもはや必要は、存在しなくなるまで、列の仕事への訪問数が繰り返されます。小さな要素は、列の先頭に「フロート」の交換を通じて、ゆっくりとなるため、アルゴリズムの名前の由来です。

 

ソートバブルを感じて、最も単純なソートアルゴリズムの一つとして、私は最も身近なので、のような、本の中で最初の最初のページ上のすべての時間を単語が表示されますを放棄ように感じます。バブルソートアルゴリズムの最適化は、要素が交換旅行トラバーサル順序で発生していないときに、フラグを設定するシーケンスが発注されていることを証明することでもあります。しかし、この改善は、パフォーマンスを向上させるために、それはあまり効果はありません。

 

(1)アルゴリズムステップ

 

  1. 隣接する要素の比較。最初は、二以上である場合には、それらの2を交換しました。

  2. 最初から最後のペアの最初の終わりには、隣接する要素のペアごとに同じ作業を行います。これが完了すると、最後の要素は、最大の数です。

  3. 最後の1を除いて、すべての要素について、これらの手順を繰り返します。

  4. 比較する必要がなくなるまで、各時間より少ないと少ない要素、数字のペアのための上記の手順を繰り返し続けました。

 

(2)可動図デモ

 

(3)のPythonコード

 

DEF バブルソート(ARR)
     のための I における範囲(1 、lenの(ARR))
         のための J の範囲(0、lenの(ARR) - I):
             もし ARR [J]> ARR [J + 1 ]:
                ARR [J ]、ARR [J + 1] = ARR [J + 1 ]、ARR [J]
     戻り ARR

 

 



2は、選択ソート
選択ソート簡単なソートアルゴリズム、どんなにであるO(n²)の時間複雑にどのようなデータ。だから、可能な限り小さくするときに、データサイズ、それを使用しています。唯一の利点は、おそらく余分なメモリスペースバーを取るされていません。

(1)アルゴリズムステップ

 

  1. まず、ソートされていない(大きい)要素の最小の配列を見つける、開始位置は、ソートされた配列に格納されます。

  2. 残りのソートされていないから、次にソートシーケンスの終わりに、最小要素(大)要素、および探し続けています。

  3. 第二段階は、全ての要素が完了ソートされるまで繰り返されます。


(2)可動図デモ

 

 

 

(3)のPythonコード

 

def selectionSort(arr):
    for i in range(len(arr) - 1):
        # 记录最小数的索引
        minIndex = i
        for j in range(i + 1, len(arr)):
            if arr[j] < arr[minIndex]:
                minIndex = j
        # i 不是最小数时,将 i 和最小数进行交换
        if i != minIndex:
            arr[i], arr[minIndex] = arr[minIndex], arr[i]
    return arr

 

3、插入排序

 

插入排序的代码实现虽然没有冒泡排序和选择排序那么简单粗暴,但它的原理应该是最容易理解的了,因为只要打过扑克牌的人都应该能够秒懂。插入排序是一种最简单直观的排序算法,它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

 

插入排序和冒泡排序一样,也有一种优化算法,叫做拆半插入。

 

(1)算法步骤

 

  1. 将第一待排序序列第一个元素看做一个有序序列,把第二个元素到最后一个元素当成是未排序序列。

  2. 从头到尾依次扫描未排序序列,将扫描到的每个元素插入有序序列的适当位置。(如果待插入的元素与有序序列中的某个元素相等,则将待插入元素插入到相等元素的后面。)

     

(2)动图演示

 

 

(3)Python 代码

 

def insertionSort(arr):
    for i in range(len(arr)):
        preIndex = i-1
        current = arr[i]
        while preIndex >= 0 and arr[preIndex] > current:
            arr[preIndex+1] = arr[preIndex]
            preIndex-=1
        arr[preIndex+1] = current
    return arr

 

4、希尔排序

 

希尔排序,也称递减增量排序算法,是插入排序的一种更高效的改进版本。但希尔排序是非稳定排序算法。

 

希尔排序是基于插入排序的以下两点性质而提出改进方法的:

  • 插入排序在对几乎已经排好序的数据操作时,效率高,即可以达到线性排序的效率;

  • 但插入排序一般来说是低效的,因为插入排序每次只能将数据移动一位;

 

希尔排序的基本思想是:先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,待整个序列中的记录“基本有序”时,再对全体记录进行依次直接插入排序。

 

(1)算法步骤

 

  1. 选择一个增量序列 t1,t2,……,tk,其中 ti > tj, tk = 1;

  2. 按增量序列个数 k,对序列进行 k 趟排序;

  3. 每趟排序,根据对应的增量 ti,将待排序列分割成若干长度为 m 的子序列,分别对各子表进行直接插入排序。仅增量因子为 1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。

 

()Python 代码

 

def shellSort(arr):
    import math
    gap=1
    while(gap < len(arr)/3):
        gap = gap*3+1
    while gap > 0:
        for i in range(gap,len(arr)):
            temp = arr[i]
            j = i-gap
            while j >=0 and arr[j] > temp:
                arr[j+gap]=arr[j]
                j-=gap
            arr[j+gap] = temp
        gap = math.floor(gap/3)
    return arr
}

 


5、归并排序

 

归并排序(Merge sort)是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。

 

作为一种典型的分而治之思想的算法应用,归并排序的实现由两种方法:

 

  • 自上而下的递归(所有递归的方法都可以用迭代重写,所以就有了第 2 种方法);

  • 自下而上的迭代;

 

和选择排序一样,归并排序的性能不受输入数据的影响,但表现比选择排序好的多,因为始终都是 O(nlogn) 的时间复杂度。代价是需要额外的内存空间。

 

(1)算法步骤

 

  1. 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列;

  2. 设定两个指针,最初位置分别为两个已经排序序列的起始位置;

  3. 比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置;

  4. 重复步骤 3 直到某一指针达到序列尾;

  5. 将另一序列剩下的所有元素直接复制到合并序列尾。

     

(2)动图演示

 

 

(3)Python 代码

 

def mergeSort(arr):
    import math
    if(len(arr)<2):
        return arr
    middle = math.floor(len(arr)/2)
    left, right = arr[0:middle], arr[middle:]
    return merge(mergeSort(left), mergeSort(right))

def merge(left,right):
    result = []
    while left and right:
        if left[0] <= right[0]:
            result.append(left.pop(0));
        else:
            result.append(right.pop(0));
    while left:
        result.append(left.pop(0));
    while right:
        result.append(right.pop(0));
    return result 

 

6、快速排序

 

快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要 Ο(nlogn) 次比较。在最坏状况下则需要 Ο(n2) 次比较,但这种状况并不常见。事实上,快速排序通常明显比其他 Ο(nlogn) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来。

 

快速排序使用分治法(Divide and conquer)策略来把一个串行(list)分为两个子串行(sub-lists)。

 

快速排序又是一种分而治之思想在排序算法上的典型应用。本质上来看,快速排序应该算是在冒泡排序基础上的递归分治法。

 

快速排序的名字起的是简单粗暴,因为一听到这个名字你就知道它存在的意义,就是快,而且效率高!它是处理大数据最快的排序算法之一了。虽然 Worst Case 的时间复杂度达到了 O(n²),但是人家就是优秀,在大多数情况下都比平均时间复杂度为 O(n logn) 的排序算法表现要更好,可是这是为什么呢,我也不知道。好在我的强迫症又犯了,查了 N 多资料终于在《算法艺术与信息学竞赛》上找到了满意的答案:

 

快速排序的最坏运行情况是 O(n²),比如说顺序数列的快排。但它的平摊期望时间是 O(nlogn),且 O(nlogn) 记号中隐含的常数因子很小,比复杂度稳定等于 O(nlogn) 的归并排序要小很多。所以,对绝大多数顺序性较弱的随机数列而言,快速排序总是优于归并排序。

 

(1)算法步骤

 

  1. 从数列中挑出一个元素,称为 “基准”(pivot);

  2. 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;

  3. 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序;

     

递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了。虽然一直递归下去,但是这个算法总会退出,因为在每次的迭代(iteration)中,它至少会把一个元素摆到它最后的位置去。

 

(2)动图演示

 

 

(3)Python 代码

 

def quickSort(arr, left=None, right=None):
    left = 0 if not isinstance(left,(int, float)) else left
    right = len(arr)-1 if not isinstance(right,(int, float)) else right
    if left < right:
        partitionIndex = partition(arr, left, right)
        quickSort(arr, left, partitionIndex-1)
        quickSort(arr, partitionIndex+1, right)
    return arr

def partition(arr, left, right):
    pivot = left
    index = pivot+1
    i = index
    while  i <= right:
        if arr[i] < arr[pivot]:
            swap(arr, i, index)
            index+=1
        i+=1
    swap(arr,pivot,index-1)
    return index-1

def swap(arr, i, j):
    arr[i], arr[j] = arr[j], arr[i]

 

 

7、堆排序

 

堆排序(Heapsort)是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构,并同时满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。堆排序可以说是一种利用堆的概念来排序的选择排序。分为两种方法:

 

  1. 大顶堆:每个节点的值都大于或等于其子节点的值,在堆排序算法中用于升序排列;

  2. 小顶堆:每个节点的值都小于或等于其子节点的值,在堆排序算法中用于降序排列;

 

堆排序的平均时间复杂度为 Ο(nlogn)。

 

(1)算法步骤

 

  1. 创建一个堆 H[0……n-1];

  2. 把堆首(最大值)和堆尾互换;

  3. 把堆的尺寸缩小 1,并调用 shift_down(0),目的是把新的数组顶端数据调整到相应位置;

  4. 重复步骤 2,直到堆的尺寸为 1。

 

(2)动图演示

 

 

(3)Python 代码

 

def buildMaxHeap(arr):
    import math
    for i in range(math.floor(len(arr)/2),-1,-1):
        heapify(arr,i)

def heapify(arr, i):
    left = 2*i+1
    right = 2*i+2
    largest = i
    if left < arrLen and arr[left] > arr[largest]:
        largest = left
    if right < arrLen and arr[right] > arr[largest]:
        largest = right

    if largest != i:
        swap(arr, i, largest)
        heapify(arr, largest)

def swap(arr, i, j):
    arr[i], arr[j] = arr[j], arr[i]

def heapSort(arr):
    global arrLen
    arrLen = len(arr)
    buildMaxHeap(arr)
    for i in range(len(arr)-1,0,-1):
        swap(arr,0,i)
        arrLen -=1
        heapify(arr, 0)
    return arr

 

8、计数排序

 

计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。

 

(1)动图演示

 

 

(2)Python 代码

 

def countingSort(arr, maxValue):
    bucketLen = maxValue+1
    bucket = [0]*bucketLen
    sortedIndex =0
    arrLen = len(arr)
    for i in range(arrLen):
        if not bucket[arr[i]]:
            bucket[arr[i]]=0
        bucket[arr[i]]+=1
    for j in range(bucketLen):
        while bucket[j]>0:
            arr[sortedIndex] = j
            sortedIndex+=1
            bucket[j]-=1
    return arr

 

9、桶排序

 

桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。为了使桶排序更加高效,我们需要做到这两点:

 

  1. 在额外空间充足的情况下,尽量增大桶的数量

  2. 使用的映射函数能够将输入的 N 个数据均匀的分配到 K 个桶中

 

同时,对于桶中元素的排序,选择何种比较排序算法对于性能的影响至关重要。

 

什么时候最快

 

当输入的数据可以均匀的分配到每一个桶中。

 

什么时候最慢

 

当输入的数据被分配到了同一个桶中。

 

Python 代码

 

def bucket_sort(s):
    """桶排序"""
    min_num = min(s)
    max_num = max(s)
    # 桶的大小
    bucket_range = (max_num-min_num) / len(s)
    # 桶数组
    count_list = [ [] for i in range(len(s) + 1)]
    # 向桶数组填数
    for i in s:
        count_list[int((i-min_num)//bucket_range)].append(i)
    s.clear()
    # 回填,这里桶内部排序直接调用了sorted
    for i in count_list:
        for j in sorted(i):
            s.append(j)

if __name__ == __main__ :
    a = [3.2,6,8,4,2,6,7,3]
    bucket_sort(a)
    print(a) # [2, 3, 3.2, 4, 6, 6, 7, 8] 

 

10、基数排序

 

基数排序是一种非比较型整数排序算法,其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。由于整数也可以表达字符串(比如名字或日期)和特定格式的浮点数,所以基数排序也不是只能使用于整数。

 

基数排序 vs 计数排序 vs 桶排序

 

基数排序有两种方法:

 

这三种排序算法都利用了桶的概念,但对桶的使用方法上有明显差异:

 

  • 基数排序:根据键值的每位数字来分配桶;

  • 计数排序:每个桶只存储单一键值;

  • 桶排序:每个桶存储一定范围的数值;

 

动图演示

 

 

Python 代码

 

def RadixSort(list):
    i = 0                                    #初始为个位排序
    n = 1                                     #最小的位数置为1(包含0)
    max_num = max(list) #得到带排序数组中最大数
    while max_num > 10**n: #得到最大数是几位数
        n += 1
    while i < n:
        bucket = {} #用字典构建桶
        for x in range(10):
            bucket.setdefault(x, []) #将每个桶置空
        for x in list: #对每一位进行排序
            radix =int((x / (10**i)) % 10) #得到每位的基数
            bucket[radix].append(x) #将对应的数组元素加入到相 #应位基数的桶中
        j = 0
        for k in range(10):
            if len(bucket[k]) != 0: #若桶不为空
                for y in bucket[k]: #将该桶中每个元素
                    list[j] = y #放回到数组中
                    j += 1
        i += 1
return  list

おすすめ

転載: www.cnblogs.com/Barrybl/p/12166686.html