快速介紹8種數(shù)據(jù)結(jié)構(gòu)
數(shù)據(jù)結(jié)構(gòu)是一種特殊的組織和存儲數(shù)據(jù)的方式,可以使我們可以更高效地對存儲的數(shù)據(jù)執(zhí)行操作。數(shù)據(jù)結(jié)構(gòu)在計算機科學(xué)和軟件工程領(lǐng)域具有廣泛而多樣的用途。
幾乎所有已開發(fā)的程序或軟件系統(tǒng)都使用數(shù)據(jù)結(jié)構(gòu)。此外,數(shù)據(jù)結(jié)構(gòu)屬于計算機科學(xué)和軟件工程的基礎(chǔ)。當(dāng)涉及軟件工程面試問題時,這是一個關(guān)鍵主題。因此,作為開發(fā)人員,我們必須對數(shù)據(jù)結(jié)構(gòu)有充分的了解。
在本文中,我將簡要解釋每個程序員必須知道的8種常用數(shù)據(jù)結(jié)構(gòu)。
1.數(shù)組
數(shù)組是固定大小的結(jié)構(gòu),可以容納相同數(shù)據(jù)類型的項目。它可以是整數(shù)數(shù)組,浮點數(shù)數(shù)組,字符串?dāng)?shù)組或什至是數(shù)組數(shù)組(例如二維數(shù)組)。數(shù)組已建立索引,這意味著可以進行隨機訪問。
Fig 1. Visualization of basic Terminology of Arrays
數(shù)組運算
· 遍歷:遍歷所有元素并進行打印。
· 插入:將一個或多個元素插入數(shù)組。
· 刪除:從數(shù)組中刪除元素
· 搜索:在數(shù)組中搜索元素。您可以按元素的值或索引搜索元素
· 更新:在給定索引處更新現(xiàn)有元素的值
數(shù)組的應(yīng)用
· 用作構(gòu)建其他數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ),例如數(shù)組列表,堆,哈希表,向量和矩陣。
· 用于不同的排序算法,例如插入排序,快速排序,冒泡排序和合并排序。
2.鏈表
鏈表是一種順序結(jié)構(gòu),由相互鏈接的線性順序項目序列組成。因此,您必須順序訪問數(shù)據(jù),并且無法進行隨機訪問。鏈接列表提供了動態(tài)集的簡單靈活的表示形式。
讓我們考慮以下有關(guān)鏈表的術(shù)語。您可以通過參考圖2來獲得一個清晰的主意。
· 鏈表中的元素稱為節(jié)點。
· 每個節(jié)點都包含一個密鑰和一個指向其后繼節(jié)點(稱為next)的指針。
· 名為head的屬性指向鏈接列表的第一個元素。
· 鏈表的最后一個元素稱為尾。
Fig 2. Visualization of basic Terminology of Linked Lists
以下是可用的各種類型的鏈表。
· 單鏈列表—只能沿正向遍歷項目。
· 雙鏈表-可以在前進和后退方向上遍歷項目。節(jié)點由一個稱為上一個的附加指針組成,指向上一個節(jié)點。
· 循環(huán)鏈接列表—鏈接列表,其中頭的上一個指針指向尾部,尾號的下一個指針指向頭。
鏈表操作
· 搜索:通過簡單的線性搜索在給定的鏈表中找到鍵為k的第一個元素,并返回指向該元素的指針
· 插入:在鏈接列表中插入一個密鑰。插入可以通過3種不同的方式完成;在列表的開頭插入,在列表的末尾插入,然后在列表的中間插入。
· 刪除:從給定的鏈表中刪除元素x。您不能單步刪除節(jié)點。刪除可以通過3種不同方式完成;從列表的開頭刪除,從列表的末尾刪除,然后從列表的中間刪除。
鏈表的應(yīng)用
· 用于編譯器設(shè)計中的符號表管理。
· 用于在使用Alt Tab(使用循環(huán)鏈表實現(xiàn))的程序之間進行切換。
3.堆棧
堆棧是一種LIFO(后進先出-最后放置的元素可以首先訪問)結(jié)構(gòu),該結(jié)構(gòu)通常在許多編程語言中都可以找到。該結(jié)構(gòu)被稱為"堆棧",因為它類似于真實世界的堆棧-板的堆棧。
Image Source: pixabay
堆棧操作
下面給出了可以在堆棧上執(zhí)行的2個基本操作。請參考圖3,以更好地了解堆棧操作。
· Push 推送:在堆棧頂部插入一個元素。
· Pop 彈出:刪除最上面的元素并返回。
Fig 3. Visualization of basic Operations of Stacks
此外,為堆棧提供了以下附加功能,以檢查其狀態(tài)。
· Peep 窺視:返回堆棧的頂部元素而不刪除它。
· isEmpty:檢查堆棧是否為空。
· isFull:檢查堆棧是否已滿。
堆棧的應(yīng)用
· 用于表達式評估(例如:用于解析和評估數(shù)學(xué)表達式的調(diào)車場算法)。
· 用于在遞歸編程中實現(xiàn)函數(shù)調(diào)用。
4.隊列
隊列是一種FIFO(先進先出-首先放置的元素可以首先訪問)結(jié)構(gòu),該結(jié)構(gòu)通常在許多編程語言中都可以找到。該結(jié)構(gòu)被稱為"隊列",因為它類似于現(xiàn)實世界中的隊列-人們在隊列中等待。
Image Source: pixabay
隊列操作
下面給出了可以在隊列上執(zhí)行的2個基本操作。請參考圖4,以更好地了解堆棧操作。
· 進隊:將元素插入隊列的末尾。
· 出隊:從隊列的開頭刪除元素。
Fig 4. Visualization of Basic Operations of Queues
隊列的應(yīng)用
· 用于管理多線程中的線程。
· 用于實施排隊系統(tǒng)(例如:優(yōu)先級隊列)。
5.哈希表
哈希表是一種數(shù)據(jù)結(jié)構(gòu),用于存儲具有與每個鍵相關(guān)聯(lián)的鍵的值。此外,如果我們知道與值關(guān)聯(lián)的鍵,則它有效地支持查找。因此,無論數(shù)據(jù)大小如何,插入和搜索都非常有效。
當(dāng)存儲在表中時,直接尋址使用值和鍵之間的一對一映射。但是,當(dāng)存在大量鍵值對時,此方法存在問題。該表將具有很多記錄,并且非常龐大,考慮到典型計算機上的可用內(nèi)存,該表可能不切實際甚至無法存儲。為避免此問題,我們使用哈希表。關(guān)于哈希表的詳細介紹可以在Python/ target=_blank class=infotextkey>Python入門與進階公眾號領(lǐng)取算法電子書
哈希函數(shù)
名為哈希函數(shù)(h)的特殊函數(shù)用于克服直接尋址中的上述問題。
在直接訪問中,帶有密鑰k的值存儲在插槽k中。使用哈希函數(shù),我們可以計算出每個值都指向的表(插槽)的索引。使用給定鍵的哈希函數(shù)計算的值稱為哈希值,它表示該值映射到的表的索引。
· h:哈希函數(shù)
· k:應(yīng)確定其哈希值的鍵
· m:哈希表的大小(可用插槽數(shù))。一個不接近2的精確乘方的素數(shù)是m的一個不錯的選擇。
Fig 5. Representation of a Hash Function
· 1→1→1
· 5→5→5
· 23→23→3
· 63→63→3
從上面給出的最后兩個示例中,我們可以看到,當(dāng)哈希函數(shù)為多個鍵生成相同的索引時,就會發(fā)生沖突。我們可以通過選擇合適的哈希函數(shù)h并使用鏈接和開放式尋址等技術(shù)來解決沖突。
哈希表的應(yīng)用
· 用于實現(xiàn)數(shù)據(jù)庫索引。
· 用于實現(xiàn)關(guān)聯(lián)數(shù)組。
· 用于實現(xiàn)"設(shè)置"數(shù)據(jù)結(jié)構(gòu)。
6.樹
樹是一種層次結(jié)構(gòu),其中數(shù)據(jù)按層次進行組織并鏈接在一起。此結(jié)構(gòu)與鏈接列表不同,而在鏈接列表中,項目以線性順序鏈接。
在過去的幾十年中,已經(jīng)開發(fā)出各種類型的樹木,以適合某些應(yīng)用并滿足某些限制。一些示例是二叉搜索樹,B樹,紅黑樹,展開樹,AVL樹和n元樹。
二叉搜索樹
顧名思義,二進制搜索樹(BST)是一種二進制樹,其中數(shù)據(jù)以分層結(jié)構(gòu)進行組織。此數(shù)據(jù)結(jié)構(gòu)按排序順序存儲值,我們將在本課程中詳細研究這些值。
二叉搜索樹中的每個節(jié)點都包含以下屬性。
· key:存儲在節(jié)點中的值。
· left:指向左孩子的指針。
· 右:指向正確孩子的指針。
· p:指向父節(jié)點的指針。
二叉搜索樹具有獨特的屬性,可將其與其他樹區(qū)分開。此屬性稱為binary-search-tree屬性。
令x為二叉搜索樹中的一個節(jié)點。
· 如果y是x左子樹中的一個節(jié)點,則y.key≤x.key
· 如果y是x的右子樹中的節(jié)點,則y.key≥x.key
Fig 6. Visualization of Basic Terminology of Trees.
樹的應(yīng)用
· 二叉樹:用于實現(xiàn)表達式解析器和表達式求解器。
· 二進制搜索樹:用于許多不斷輸入和輸出數(shù)據(jù)的搜索應(yīng)用程序中。
· 堆:由JVM(JAVA虛擬機)用來存儲Java對象。
· Trap:用于無線網(wǎng)絡(luò)。
7.堆
堆是二叉樹的一種特殊情況,其中將父節(jié)點與其子節(jié)點的值進行比較,并對其進行相應(yīng)排列。
讓我們看看如何表示堆。堆可以使用樹和數(shù)組表示。圖7和8顯示了我們?nèi)绾问褂枚鏄浜蛿?shù)組來表示二叉堆。
Fig 7. Binary Tree Representation of a Heap
Fig 8. Array Representation of a Heap
堆可以有2種類型。
· 最小堆-父項的密鑰小于或等于子項的密鑰。這稱為min-heap屬性。根將包含堆的最小值。
· 最大堆數(shù)-父項的密鑰大于或等于子項的密鑰。這稱為max-heap屬性。根將包含堆的最大值。
堆的應(yīng)用
· 用于實現(xiàn)優(yōu)先級隊列,因為可以根據(jù)堆屬性對優(yōu)先級值進行排序。
· 可以在O(log n)時間內(nèi)使用堆來實現(xiàn)隊列功能。
· 用于查找給定數(shù)組中k個最?。ɑ蜃畲螅┑闹怠?/p>
· 用于堆排序算法。
8.圖
一個圖由一組有限的頂點或節(jié)點以及一組連接這些頂點的邊組成。
圖的順序是圖中的頂點數(shù)。圖的大小是圖中的邊數(shù)。
如果兩個節(jié)點通過同一邊彼此連接,則稱它們?yōu)橄噜徆?jié)點。
有向圖
如果圖形G的所有邊緣都具有指示什么是起始頂點和什么是終止頂點的方向,則稱該圖形為有向圖。
我們說(u,v)從頂點u入射或離開頂點u,然后入射到或進入頂點v。
自環(huán):從頂點到自身的邊。
無向圖
如果圖G的所有邊緣均無方向,則稱其為無向圖。它可以在兩個頂點之間以兩種方式傳播。
如果頂點未連接到圖中的任何其他節(jié)點,則稱該頂點為孤立的。
Fig 9. Visualization of Terminology of Graphs
圖的應(yīng)用
· 用于表示社交媒體網(wǎng)絡(luò)。每個用戶都是一個頂點,并且在用戶連接時會創(chuàng)建一條邊。
· 用于表示搜索引擎的網(wǎng)頁和鏈接。互聯(lián)網(wǎng)上的網(wǎng)頁通過超鏈接相互鏈接。每頁是一個頂點,兩頁之間的超鏈接是一條邊。用于google中的頁面排名。
· 用于表示GPS中的位置和路線。位置是頂點,連接位置的路線是邊。用于計算兩個位置之間的最短路徑。
參考文獻
[1]算法簡介,第三版,作者:托馬斯·H·科門(Thomas H. Cormen),查爾斯·E·雷森(Charles E. Leiserson),羅納德·L·里維斯特(Ronald L. Rivest)和克利福德·斯坦(Clifford Stein)。
[2]來自Wikipedia的數(shù)據(jù)結(jié)構(gòu)列表
(本文翻譯自Vijini Mallawaarachchi的文章《8 Common Data Structures every Programmer must know》,參考:https://towardsdatascience.com/8-common-data-structures-every-programmer-must-know-171acf6a1a42)