您好,登錄后才能下訂單哦!
著名數(shù)據(jù)專家沃斯曾說:算法+數(shù)據(jù)結(jié)構(gòu)=程序
上次講了數(shù)據(jù)結(jié)構(gòu)
這回就講講算法
復雜度分析,是貫徹數(shù)據(jù)結(jié)構(gòu)和算法中的一項基礎(chǔ)技能,學習數(shù)據(jù)結(jié)構(gòu)和算法的目的,無非就是要寫出占用空間更小、運行時間更短的代碼。
T(n) = O(f(n))
多項式量級:
非多項式量級:(n越多,執(zhí)行時間急劇上升,性能低)
可以用遞歸的條件:
寫遞歸算法的思路:
遞歸代碼的弊端:
衡量排序算法好壞的三要素:
按時間復雜度分類:
原理: 從下往上,逐次比較兩個相鄰的數(shù)據(jù),如果下面的數(shù)據(jù)比上面的數(shù)據(jù)大,則把這兩個數(shù)據(jù)的位置互換。
原理: 分為已排區(qū)域和未排區(qū)域,每次拿未排區(qū)域中的第一個數(shù),插入到已排區(qū)域中正確的位置。
原理: 分為已排區(qū)域和未排區(qū)域,每次從未排區(qū)域中選取最小的數(shù),放到已排區(qū)域的最后面。
原理: 歸并排序的核心思想還是蠻簡單的。如果要排序一個數(shù)組,我們先把數(shù)組從中間分成前后兩部分,然后對前后兩部分分別排序,再將排好序的兩部分合并在一起,這樣整個數(shù)組就都有序了。
merge_sort(p…r) = merge(merge_sort(p…q), merge_sort(q+1…r))
quick_sort(p…r) = partition(p…r) + quick_sort(p…q-1) + quick_sort(q+1, r)
桶排序,顧名思義,會用到“桶”,核心思想是將要排序的數(shù)據(jù)分到幾個有序的桶里,每個桶里的數(shù)據(jù)再單獨進行排序。桶內(nèi)排完序之后,再把每個桶里的數(shù)據(jù)按照順序依次取出,組成的序列就是有序的了。
桶排序的時間復雜度為什么是 O(n) 呢?我們一塊兒來分析一下。如果要排序的數(shù)據(jù)有 n 個,我們把它們均勻地劃分到 m 個桶內(nèi),每個桶里就有 k=n/m 個元素。每個桶內(nèi)部使用快速排序,時間復雜度為 O(k * logk)。m 個桶排序的時間復雜度就是 O(m * k * logk),因為 k=n/m,所以整個桶排序的時間復雜度就是 O(n*log(n/m))。當桶的個數(shù) m 接近數(shù)據(jù)個數(shù) n 時,log(n/m) 就是一個非常小的常量,這個時候桶排序的時間復雜度接近 O(n)。
苛刻的條件:
計數(shù)排序其實是桶排序的一種特殊情況: 數(shù)據(jù)的訪問很?。ɡ缒挲g、考生的成績),桶的數(shù)量是有限的。 以給高考考生成績進行排名為例,考生的滿分是 900 分,最小是 0 分,對應(yīng)901個桶,把全國的考生放入這901個桶,桶內(nèi)的數(shù)據(jù)都是分數(shù)相同的考生,所以并不需要再進行排序。
特殊要求:
我們再來看這樣一個排序問題。假設(shè)我們有 10 萬個手機號碼,希望將這 10 萬個手機號碼從小到大排序,你有什么比較快速的排序方法呢?
我們之前講的快排,時間復雜度可以做到 O(nlogn),還有更高效的排序算法嗎?桶排序、計數(shù)排序能派上用場嗎?手機號碼有 11 位,范圍太大,顯然不適合用這兩種排序算法。針對這個排序問題,有沒有時間復雜度是 O(n) 的算法呢?現(xiàn)在我就來介紹一種新的排序算法,基數(shù)排序。
剛剛這個問題里有這樣的規(guī)律:假設(shè)要比較兩個手機號碼 a,b 的大小,如果在前面幾位中,a 手機號碼已經(jīng)比 b 手機號碼大了,那后面的幾位就不用看了。
借助穩(wěn)定排序算法,這里有一個巧妙的實現(xiàn)思路。還記得我們第 11 節(jié)中,在闡述排序算法的穩(wěn)定性的時候舉的訂單的例子嗎?我們這里也可以借助相同的處理思路,先按照最后一位來排序手機號碼,然后,再按照倒數(shù)第二位重新排序,以此類推,最后按照第一位重新排序。經(jīng)過 11 次排序之后,手機號碼就都有序了。
手機號碼稍微有點長,畫圖比較不容易看清楚,我用字符串排序的例子,畫了一張基數(shù)排序的過程分解圖,你可以看下。
注意,這里按照每位來排序的排序算法要是穩(wěn)定的,否則這個實現(xiàn)思路就是不正確的。因為如果是非穩(wěn)定排序算法,那最后一次排序只會考慮最高位的大小順序,完全不管其他位的大小關(guān)系,那么低位的排序就完全沒有意義了。
根據(jù)每一位來排序,我們可以用剛講過的桶排序或者計數(shù)排序,它們的時間復雜度可以做到 O(n)。如果要排序的數(shù)據(jù)有 k 位,那我們就需要 k 次桶排序或者計數(shù)排序,總的時間復雜度是 O(k*n)。當 k 不大的時候,比如手機號碼排序的例子,k 最大就是 11,所以基數(shù)排序的時間復雜度就近似于 O(n)。
實際上,有時候要排序的數(shù)據(jù)并不都是等長的,比如我們排序牛津字典中的 20 萬個英文單詞,最短的只有 1 個字母,最長的我特意去 查了下,有 45 個字母,中文翻譯是塵肺病。對于這種不等長的數(shù)據(jù),基數(shù)排序還適用嗎?
實際上,我們可以把所有的單詞補齊到相同長度,位數(shù)不夠的可以在后面補“0”,因為根據(jù)ASCII 值,所有字母都大于“0”,所以補“0”不會影響到原有的大小順序。這樣就可以繼續(xù)用基數(shù)排序了。
我來總結(jié)一下,基數(shù)排序?qū)σ判虻臄?shù)據(jù)是有要求的:
學習視頻內(nèi)容可以看這里: https://zhuanlan.zhihu.com/p/96231226
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。