常見數(shù)據(jù)結(jié)構(gòu)和算法的應用系列示例分析

發(fā)布時間：2022-01-04 16:40:10 來源：億速云閱讀：125 作者：柒染欄目：大數(shù)據(jù)

這篇文章將為大家詳細講解有關(guān)常見數(shù)據(jù)結(jié)構(gòu)和算法的應用系列示例分析，文章內(nèi)容質(zhì)量較高，因此小編分享給大家做個參考，希望大家閱讀完這篇文章后對相關(guān)知識有一定的了解。

數(shù)據(jù)結(jié)構(gòu)是指：一種數(shù)據(jù)組織、管理和存儲的格式，它可以幫助我們實現(xiàn)對數(shù)據(jù)高效的訪問和修改。

數(shù)據(jù)結(jié)構(gòu) = 數(shù)據(jù)元素 + 元素之間的結(jié)構(gòu)。

如果說數(shù)據(jù)結(jié)構(gòu)是造大樓的骨架，算法就是具體的造樓流程。流程不同，效率資源不同。我會兩者結(jié)合簡單探討下他們的特點和應用。

常見的數(shù)據(jù)結(jié)構(gòu)可分為：線性結(jié)構(gòu)、樹形結(jié)構(gòu) 和圖狀結(jié)構(gòu)。

常見的算法有：遞歸、排序、二分查找、搜索、哈希算法、貪心算法、分治算法、回溯算法、動態(tài)規(guī)劃、字符串匹配算法等。

下面從 線性數(shù)據(jù)結(jié)構(gòu)、遞歸和排序算法 談起。

線性結(jié)構(gòu)

線性結(jié)構(gòu)：是指數(shù)據(jù)排成像一條線一樣的結(jié)構(gòu)。每個元素結(jié)點最多對應一個前驅(qū)結(jié)點和一個后繼結(jié)點。如數(shù)組, 鏈表，棧，隊列等。

數(shù)組

數(shù)組是是由相同類型的元素（element）的集合所組成的數(shù)據(jù)結(jié)構(gòu)，分配一塊連續(xù)的內(nèi)存來存儲。利用元素的下標位置可以計算出該元素對應的存儲地址。

常見數(shù)據(jù)結(jié)構(gòu)和算法的應用系列示例分析 — 圖片來源自網(wǎng)絡，侵刪

優(yōu)點：
分配基于連續(xù)內(nèi)存，是一種天生的索引結(jié)構(gòu)，查詢修改元素的效率O(1)。同時可以借助 CPU 的緩存機制，預讀數(shù)組中的數(shù)據(jù)，所以訪問效率更高。

缺點：
數(shù)組的索引優(yōu)點也是它的缺點，因為它的索引是基于一塊連續(xù)內(nèi)存元素存儲的位置下標決定的，增刪arr[i]時間復雜度O(n)，需要整體移動數(shù)組arr[i-n-1]的位置。此外，分配大數(shù)組會占用較大的內(nèi)存。

可通過以下方式避免元素拷貝和占用大的開銷：

1.懶刪除：刪除時只標記元素被刪除，并不真正的執(zhí)行刪除。當數(shù)組整體內(nèi)存不夠用時，再執(zhí)行真正的刪除。
2.分塊思想：將一大塊內(nèi)存分為n個小塊，以小塊為單位進行數(shù)組內(nèi)存的拷貝。如Mysql的InnoDB引擎中每個Buffer Pool實例由若干個chunk組成，實際內(nèi)存申請操作以chunk為單位。
3.縮容：曾經(jīng)面試阿里時，就讓設(shè)計了一個縮容版的HashMap。浪費可恥，節(jié)約光榮。
4.鏈表。

鏈表

鏈表的存在就是為了解決數(shù)組的增刪復雜耗時，內(nèi)存占用較大的問題。它并不需要一塊連續(xù)的內(nèi)存空間，它通過指針將一組零散的內(nèi)存塊串聯(lián)起來。根據(jù)指針的不同，有單鏈表，雙向鏈表，循環(huán)鏈表之分。

優(yōu)點：
增刪arr[i]時間復雜度O(1)，使用鏈表本身沒有大小的限制，天然地支持動態(tài)擴容。

缺點：
沒有“索引”，查詢時間復雜度O(n)。需要維護指針，更占內(nèi)存。同時內(nèi)存不連續(xù)，容易造成內(nèi)存碎片。

可以看出：數(shù)組和鏈表是相互補充的一對數(shù)據(jù)結(jié)構(gòu)。那怎么彌補鏈表的不足呢？

內(nèi)存這塊是不好解決，這是由指針決定的。

關(guān)于索引，沒索引就幫它建索引好了：

1.結(jié)合hash表，記錄鏈表每個結(jié)點的位置。
2.鏈表長度拉的過長時，考慮跳表，紅黑樹這類數(shù)據(jù)結(jié)構(gòu)。（別慌，后面會講～）

應用場景：
數(shù)組和鏈表的運用很廣泛，他們是構(gòu)成數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ)。如棧，隊列，集合等等。

棧

棧是一種受限制的線性數(shù)據(jù)結(jié)構(gòu)。元素只可以在棧頂被訪問。符合先進后出的First-In-Last-Out的訪問方式。

用數(shù)組實現(xiàn)的叫順序棧，用鏈表實現(xiàn)的叫鏈式棧。

可能有人會有疑問：我用數(shù)組鏈表在頭尾兩端可伸可縮，為毛要用只能在頭部操作的棧結(jié)構(gòu)呢？

這種FILO的結(jié)構(gòu)當然是只適用于FILO的場景。如果我們將數(shù)組/鏈表這種結(jié)構(gòu)封裝為棧，就可以只使用其pop/push的API，屏蔽掉實現(xiàn)細節(jié)。

應用場景：
1.編輯器的redo/undo操作。
2.瀏覽器的前進/后退操作。
3.編譯器的括號匹配校驗
4.數(shù)學計算中的表達式求值
5.函數(shù)調(diào)用
6.遞歸
7.字符串反轉(zhuǎn)…

隊列

隊列也是一種受限制的線性數(shù)據(jù)結(jié)構(gòu)。符合先進先出的First-In-First-Out 的訪問方式。同樣，用數(shù)組實現(xiàn)的隊列叫作順序隊列，用鏈表實現(xiàn)的隊列叫作鏈式隊列。

根據(jù)頭尾指針和操作的不同，隊列又可分為雙端隊列，循環(huán)隊列，阻塞隊列，并發(fā)隊列。

雙端隊列：頭尾均可以進行插入，刪除，訪問元素，更為實用。不存在FIFO這種限制。

圖片來源自網(wǎng)絡，侵刪
循環(huán)隊列：把隊列的頭尾相連接并且使用順序存儲結(jié)構(gòu)進行數(shù)據(jù)存儲的隊列。

圖片來源自網(wǎng)絡，侵刪

存在并發(fā)的場景下，隊列存取元素的臨界區(qū)為 enqueue、dequeue操作。保證并發(fā)下的隊列存取安全的隊列為阻塞隊列和并發(fā)隊列。兩者的區(qū)別在于同步資源的粒度不同。

阻塞隊列：通過 互斥鎖 保證enqueue、dequeue的安全，鎖粒度較大。如Java JUC包中的阻塞隊列。
并發(fā)隊列：基于數(shù)組的循環(huán)隊列，利用 CAS 原子操作保證enqueue、dequeue的安全。
其實就是通過：多次volatile讀 + CAS操作 這種樂觀思想修改頭尾指針的位置，保證enqueue、dequeue的安全。CAS的同步代價小較小，所以稱為：無鎖并發(fā)隊列。如Disruptor框架中Ring Buffer就運用了這點。

PS: 很多框架對線程池的需求都替換成了Disruptor來實現(xiàn)，如Log4j2、Canal等。

應用場景：
隊列的作用其實就是現(xiàn)實中的排隊。當資源不足時，通過“隊列” 這種結(jié)構(gòu)來實現(xiàn)排隊的效果。用于：
1.任務調(diào)度存在的地方：CPU/磁盤/線程池/任務調(diào)度框架…
2.兩個進程中數(shù)據(jù)的傳遞：如pipe/file IO/IO Buffer…
3.生產(chǎn)者消費者場景中..

遞歸實現(xiàn)

遞歸是一種算法求解的編碼實現(xiàn)。應用于如深度優(yōu)先搜索、前中后序二叉樹遍歷（挖坑后面講～）等。因為接下來的排序算法如：歸并/快排可通過遞歸來實現(xiàn)，所以我們先看一下書寫遞歸的步驟。熟悉了遞歸的思想，它其實是一種書寫簡單的編碼方式。

只要問題滿足以下三點，均可使用遞歸來進行求解：

1.一個問題的解可以分解為幾個子問題的解
2.問題和子問題之間，除了數(shù)據(jù)規(guī)模不同，求解思路完全一樣
3.存在遞歸終止條件

寫遞歸代碼的關(guān)鍵在于：找到如何將大問題分解為小問題的規(guī)律，并且基于此寫出遞推公式，然后再敲定終止條件，最后將遞推公式和終止條件翻譯成代碼。

因為人并不擅長處理這種程序，所以在寫遞歸代碼的時候，我們可以自動屏蔽掉遞歸的執(zhí)行過程。我們只需要告訴程序：遞推公式 和 終止條件 是什么，事情就會變Easy~

使用時的注意項：

1.stackoverflow: 實際函數(shù)調(diào)用層次太深，就會有系統(tǒng)?；蛘咛摂M機棧空間溢出的風險。

2.子問題的重復計算：前面文章我有講動態(tài)規(guī)劃通過避免子問題的重復計算能夠降低時間復雜度。一種方式就是通過遞歸 + 備忘錄（子問題的解保存起來）來解決。

排序算法

233醬學習的第一個算法就是冒泡排序算法，我想不少碼農(nóng)都經(jīng)歷過被 “幾大排序算法” 支配的恐懼。

排序是我們在項目工程中經(jīng)常遇到的一個場景，如TopK，中位數(shù)問題等。有序和無序的數(shù)據(jù)集合之間的差別在于前者 “逆序?qū)Α?/strong> 為0.

小貼士：如果i < j，且a[i] > a[j], 就稱為一個逆序?qū)Γ?1，7，3，5 中的 <7，5>
反之則為有序?qū)?，?lt;1,3>

不同的排序算法消滅逆序?qū)Φ姆绞讲灰粯樱w現(xiàn)在時空復雜度，排序方式，穩(wěn)定性，適用場景等方面不同。

我先放一張網(wǎng)上排序算法的圖：

選擇排序算法時，我們應該考慮算法的執(zhí)行效率，內(nèi)存消耗，穩(wěn)定性等這些因素。

PS：以下內(nèi)容主要引用極客時間王爭大佬的《數(shù)據(jù)結(jié)構(gòu)和算法之美》課程，233能力有限，默默給大佬打廣告&點贊。

如何分析排序算法的執(zhí)行效率
1. 最好情況、最壞情況、平均情況時間復雜度
對于要排序的原始數(shù)據(jù)，數(shù)據(jù)的有序度不同，對排序的執(zhí)行效率是有影響的。比如接近有序的待排序數(shù)據(jù) 插入排序的時間復雜度接近O(n)。我們需要了解排序算法在不同數(shù)據(jù)下的性能表現(xiàn)。
2.時間復雜度的系數(shù)、常數(shù) 、低階
在對小規(guī)模的數(shù)據(jù)排序時，如10個，100個，1000個。需要把系數(shù)、常數(shù)、低階也考慮進來，才能選擇合適的排序算法。
3.比較次數(shù)和交換（或移動）次數(shù)
基于比較的排序算法的執(zhí)行過程，會涉及兩種操作，一種是元素比較大小，另一種是元素交換或移動。所以，如果我們在分析排序算法的執(zhí)行效率的時候，應該把比較次數(shù)和交換（或移動）次數(shù)也考慮進去。

排序算法的內(nèi)存消耗
上圖中有一列排序方式：原地排序（In-place）和外部排序(Out-place)。前者是指空間復雜度為O(1)的排序算法，不需要在外部開辟內(nèi)存空間。后者需要額外開辟空間來存儲中間狀態(tài)。前者的好處在于可以借助 CPU 的緩存機制，訪問效率更高。這是一個重要的考量因素。
小貼士：快排的空間復雜度為是因為它的實現(xiàn)是遞歸調(diào)用的，每次函數(shù)調(diào)用中只使用了常數(shù)的空間，因此空間復雜度等于遞歸深度O(logn)。

排序算法的穩(wěn)定性
穩(wěn)定性是指：待排序的序列中存在值相等的元素，經(jīng)過排序之后，相等元素之間原有的先后順序是不變的。
為啥要考慮排序算法的穩(wěn)定性呢？
這是因為實際場景中的待排序的對象排序維度可能是多個。比如我們對訂單先按照金額排序，再按照下單時間排序。實現(xiàn)簡單的思路為：先給訂單按照下單時間排序，再按照金額排序。穩(wěn)定性的排序算法能夠保證金額相同的兩個對象，在排序之后的下單順序不變。
下面主要從數(shù)據(jù)規(guī)模上討論這些排序算法的應用。
小規(guī)模數(shù)據(jù)排序
在小規(guī)模數(shù)據(jù)下，冒泡排序/選擇排序/插入排序?qū)崿F(xiàn)較為簡單，排除不穩(wěn)定的選擇排序，插入排序（可類比打撲克抓牌時的排序思想）比冒泡排序（最大元素依次往后冒）好在交換次數(shù)少，小規(guī)模下排序效率更高。
此外當待排序序列的有序度比較高時，插入排序也好過歸并/快排這類O(nlogn)的效率。所以在小規(guī)模數(shù)據(jù)場景下，適合用插入排序。
大規(guī)模內(nèi)存級數(shù)據(jù)排序

大規(guī)模數(shù)據(jù)排序適合考慮O(nlogn)級別的排序算法，這里討論歸并排序和快速排序。
歸并排序的思想是分治思想。將整個無序序列的排序劃分為無序小序列的排序問題。子序列有序了，再合并起來有序的子序列，整體就排好序了。
歸并排序是外部排序。每次合并操作都需要申請額外的內(nèi)存空間，在合并完成之后，臨時開辟的內(nèi)存空間就被釋放掉了。在任意時刻，CPU 只會有一個函數(shù)在執(zhí)行，也就只會有一個臨時的內(nèi)存空間在使用。臨時內(nèi)存空間最大也不會超過 n 個數(shù)據(jù)的大小，所以空間復雜度是 O(n)。
快速排序利用的也是分治思想。局部有序最終導致全局有序。它使用一個分區(qū)點數(shù)據(jù)(pivort)將元素分為< pivort,=pivort,>pivort三個部分。然后在< pivort 和 >pivort這兩部分繼續(xù)遞歸處理，最終排序完成。
如果快排合理的選擇pivort，多路指針參與分區(qū)可以避免時間復雜度的惡化。而且快排是原地排序，相比歸并排序是外部排序，空間復雜度較高O(n)?？炫诺膽酶鼮閺V泛。
Java中Arrays.sort是混合排序，實現(xiàn)策略分為兩種：
Case1. 存儲的數(shù)據(jù)類型是基本數(shù)據(jù)類型
使用的是快排，在數(shù)據(jù)量很小的時候，使用的插入排序；
Case2. 存儲的數(shù)據(jù)類型是Object
使用的是歸并排序，在數(shù)據(jù)量很小的時候，使用的也是插入排序。
大規(guī)模外部數(shù)據(jù)排序
當數(shù)據(jù)規(guī)模很大時，我們并不能把所有數(shù)據(jù)都加載到內(nèi)存。這時候可以考慮時間復雜度是 O(n) 的外部排序算法：桶排序、計數(shù)排序、基數(shù)排序。外部排序是指數(shù)據(jù)存儲在外部磁盤中。
這里時間復雜度之所以低是因為：這三個算法是非基于比較的排序算法，都不涉及元素之間的比較操作。
桶排序 是按照某種屬性將元素分配到全局有序的子桶內(nèi)，再在子桶內(nèi)做局部排序。當子桶個數(shù)劃分的足夠大時，時間復雜度就接近O(n) 。
計數(shù)排序 其實是桶排序的一種特殊情況。當要排序的 n 個數(shù)據(jù)，所處的范圍并不大的時候，比如最大值是 k，我們就可以把數(shù)據(jù)劃分成 k 個桶。每個桶內(nèi)的數(shù)據(jù)值都是相同的，省掉了桶內(nèi)排序的時間。
基數(shù)排序 是根據(jù)每一位來排序，基數(shù)排序?qū)σ判虻臄?shù)據(jù)是有要求的，需要可以分割出獨立的“位”來比較，而且位之間有遞進的關(guān)系，如果 a 數(shù)據(jù)的高位比 b 數(shù)據(jù)大，那剩下的低位就不用比較了。除此之外，每一位的數(shù)據(jù)范圍不能太大，要可以用線性排序算法來排序，否則，基數(shù)排序的時間復雜度就無法做到 O(n) 了。

關(guān)于常見數(shù)據(jù)結(jié)構(gòu)和算法的應用系列示例分析就分享到這里了，希望以上內(nèi)容可以對大家有一定的幫助，可以學到更多知識。如果覺得文章不錯，可以把它分享出去讓更多的人看到。

向AI問一下細節(jié)

推薦閱讀：

Java數(shù)據(jù)結(jié)構(gòu)和算法系列———隊列

Java數(shù)據(jù)結(jié)構(gòu)和算法系列———棧

免責聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

數(shù)據(jù)結(jié)構(gòu)

上一篇新聞：
CinemaGrade for Mac有哪些功能

下一篇新聞：
JS的script標簽屬性有哪些

猜你喜歡

r語言怎么擬合ARIMA模型

java獲取數(shù)據(jù)類型的方法有哪些

linux運行bat文件失敗怎么解決

mybatis中set標簽的應用場景有哪些

mysql連接數(shù)據(jù)庫的步驟是什么

java中怎么遍歷實體類獲取屬性值

R語言怎么進行情感分析和詞頻統(tǒng)計

python怎么批量執(zhí)行多個py文件

linux中du命令的作用是什么

mybatis page分頁的原理是什么

最新資訊

Android Studio中控件的陰影效果如何實現(xiàn)

控件事件監(jiān)聽器編寫規(guī)范

控件單元測試編寫與執(zhí)行

Android Studio控件API變更追蹤

控件狀態(tài)保存與恢復機制

控件觸摸反饋自定義

控件動態(tài)添加與移除技巧

控件無障礙設(shè)計在Android Studio中

控件權(quán)限與隱私保護考量

控件樣式繼承與覆蓋策略

相關(guān)推薦

JS中常見排序Sort算法的示例分析

Python中數(shù)據(jù)結(jié)構(gòu)和算法的示例分析

python數(shù)據(jù)結(jié)構(gòu)和算法的示例分析

JavaScript中數(shù)據(jù)結(jié)構(gòu)與算法之檢索算法的示例分析

Java數(shù)組常見應用的示例分析

java數(shù)據(jù)結(jié)構(gòu)和算法中數(shù)組的示例分析

Python數(shù)據(jù)結(jié)構(gòu)與算法的示例分析

python數(shù)據(jù)結(jié)構(gòu)算法的示例分析

Java數(shù)據(jù)結(jié)構(gòu)和算法之鏈表的示例分析

Java數(shù)據(jù)結(jié)構(gòu)與算法的示例分析

相關(guān)標簽

數(shù)據(jù)結(jié)構(gòu)與算法 python內(nèi)置數(shù)據(jù)結(jié)構(gòu) 數(shù)據(jù)結(jié)構(gòu) 隊列 redis數(shù)據(jù)結(jié)構(gòu) 數(shù)據(jù)結(jié)構(gòu)和算法 python數(shù)據(jù)結(jié)構(gòu) 樹狀數(shù)據(jù)結(jié)構(gòu) c++ new javascript java js es6 mysql golang bitmap index ios linkedlist go