一、前言
什么是算法?算法是某種集合,是簡單指令的集合,是被指定的簡單指令集合。確定該算法重要的指標:
- 第一是否能解決問題;
- 第二算法運行時間,即解決問題出結果需要多少時間;
- 還有所需的空間資源,比如內存等。
很多時候,寫一個工作程序并不夠。因為遇到大數據下,運行時間就是一個重要的問題。
算法性能用大 O 標記法表示。大 O 標記法是標記相對增長率,精度是粗糙的。比如 2N 和 3N + 2 ,都是 O(N)。也就是常說的線性增長,還有常說的指數增長等
典型的增長率
典型的提供性能做法是分治法,即分支 divide and conquer 策略:
- 將問題分成兩個大致相等的子問題,遞歸地對它們求解,這是分的部分;
- 治階段將兩個子問題的解修補到一起,并可能再做些少量的附加工作,最后得到整個問題的解。
二、排序
排序問題,是古老,但一直流行的問題。從 ACM 接觸到現在工作,每次涉及算法,或品讀 JDK 源碼中一些算法,經常會有排序的算法出現。
排序算法是為了將一組數組(或序列)重新排列,排列后數據符合從大到小(或從小到大)的次序。這樣數據從無序到有序,會有什么好處?
- 應用層面:解決問題。
- 最簡單的是可以找到最大值或者最小值
- 解決"一起性"問題,即相同標志元素連在一起
- 匹配在兩個或者更多個文件中的項目
- 通過鍵碼值查找信息
- 系統層面:減少系統的熵值,增加系統的有序度 (Donald Knuth 的經典之作《計算機程序設計藝術》(The Art of Computer Programming)的第三卷)
通過維基百科查閱資料得到:在主內存中完成的排序叫做,內部排序。那需要在磁盤等其他存儲完成的排序,叫做外部排序 external sorting。
接口是一個抽象類型,是抽象方法(compareTo)的集合,用 interface 來聲明。因此被排序的對象屬于 Comparable 類型,即實現 Comparable 接口,然后調用對象實現的 compareTo 方法進行比較后排序。
在這些條件下的排序,叫作基于比較的排序(comparison-based sorting)
三、插入排序
白話文:熊大(一)、熊二、熊三... 按照身高從低到高排隊(排序)。這時候熊 N 加入隊伍,它從隊伍尾巴開始比較。如果它比前面的熊身高低,則與被比較的交換位置,依次從尾巴到頭部進行比較 & 交換位置。最終換到了應該熊 N 所在的位置。這就是插入排序的原理。
插入排序(insertion sort)
- 最簡單的排序之一。ps: 冒泡排序看看就好,不推薦學習
- 由 N - 1 次排序過程組成。
- 如果被排序的這樣一個元素,就不需要排序。即 N =1 (1 - 1 = 0)
- 每一次排序保證,從第一個位置到當前位置的元素為已排序狀態。
- 如圖:每個元素往前進行比較,并終止于自己所在的位置
代碼解析如下:
- 從數組的第二個元素,向前開始比較。比第一個元素小,則交換位置
- 如果第二個元素比較完畢,那就第三個,第四個... 以此類推
- 比較到最后一個元素時,完成排序
時間復雜度是 O(N^2),最好情景的是排序已經排好的,那就是 O(N),因為滿足不了循環的判斷條件;最極端的是反序的數組,那就是 O(N^2)。所以該算法的時間復雜度為 O(N^2)
運行 main 方法,結果如下:
[2, 3, 1, 4, 3] [1, 2, 3, 3, 4]
再考慮考慮優化,會怎么優化呢?插入排序優化版 不是往前比較 。往前的一半比較,二分比較會更好。具體代碼,可以自行試試
四、Array.sort 源碼中的插入排序
上面用自己實現的插入算法進行排序,其實 JDK 提供了 Array.sort 方法,方便排序。案例代碼如下:
運行 main 方法,結果如下:
[2, 3, 1, 4, 3] [1, 2, 3, 3, 4]
那 Arrays.sort 是如何實現的呢?JDK 1.2 的時候有了 Arrays ,JDK 1.8 時優化了一版 sort 算法。大致如下:
- 如果元素數量小于 47,使用插入排序
- 如果元素數量小于 286,使用快速排序
- Timsort 算法整合了歸并排序和插入排序
源碼中我們看到了 mergeSort 里面整合了插入排序算法,跟上面實現的異曲同工。這邊就不一行一行解釋了。
五、小結
算法是解決問題的。所以不一定一個算法解決一個問題,可能多個算法一起解決一個問題。達到問題的最優解。插入排序,這樣就這么簡單