數據結構是一種在計算機中組織和存儲數據的專門方法,使我們可以更有效地對存儲的數據執行操作。數據結構在計算機科學和軟件工程領域有著廣泛而多樣的使用范圍。
幾乎所有已開發的程序或軟件系統都在使用數據結構。此外,數據結構屬于計算機科學和軟件工程的基礎知識。當涉及到軟件工程面試問題時,這是一個關鍵話題。因此,作為開發人員,我們必須對數據結構有很好的了解。
在這篇文章中,我將簡要解釋每個程序員都必須了解的 8 種常用數據結構。
1、數組(Arrays)
數組是一種固定大小的結構,可以容納相同數據類型的項。它可以是整數數組、浮點數數組、字符串數組甚至數組的數組(例如二維數組)。數組是有索引的,這意味著可以進行隨機訪問。
數組運算
- 遍歷:遍歷元素并打印它們。
- 搜索:搜索數組中的元素。您可以按元素的值或索引搜索元素
- 更新:更新給定索引處現有元素的值
由于數組的大小是固定的,因此無法立即向數組插入元素和從數組中刪除元素。如果要將元素插入數組,首先必須創建一個大小增加的新數組(當前大小 + 1),復制現有元素并添加新元素。對于刪除尺寸減小的新數組也是如此。
數組的應用
- 用作構建其他數據結構(例如數組列表、堆、哈希表、向量和矩陣)的構建塊。
- 用于不同的排序算法,例如插入排序、快速排序、冒泡排序和合并排序。
2、鏈表(Linked Lists)
鏈表是一種順序結構,由一系列按線性順序相互鏈接的項目組成。因此,您必須順序訪問數據,而隨機訪問是不可能的。鏈接列表提供了動態集的簡單而靈活的表示。
讓我們考慮以下有關鏈表的術語。
- 鏈表中的元素稱為節點。
- 每個節點都包含一個鍵和一個指向其后繼節點(稱為next )的指針。
- 名為head 的屬性指向鏈表的第一個元素。
- 鏈表的最后一個元素稱為尾部。
以下是可用的各種類型的鏈接列表。
- 單鏈表——項目的遍歷只能向前進行。
- 雙向鏈表——可以向前和向后兩個方向遍歷項目。節點由一個稱為prev的附加指針組成,指向前一個節點。
- 循環鏈表——頭部的prev指針指向尾部,尾部的next指針指向頭部的鏈表。
鏈表操作
- 搜索:通過簡單的線性搜索找到給定鏈表中第一個具有鍵k的元素,并返回指向該元素的指針
- 插入:向鏈表插入一個鍵。插入可以通過 3 種不同的方式完成;插入在列表的開頭,插入在列表的末尾,插入在列表的中間。
- 刪除:從給定的鏈表中刪除元素x 。您無法通過一步刪除節點。可以通過 3 種不同的方式進行刪除;從列表開頭刪除、從列表末尾刪除、從列表中間刪除。
鏈表的應用
- 用于編譯器設計中的符號表管理。
- 用于使用 Alt + Tab 在程序之間切換(使用循環鏈表實現)。
3、堆棧(Stacks)
堆棧是一種LIFO(后進先出 - 最后放置的元素可以首先訪問)結構,在許多編程語言中都很常見。這種結構被命名為“堆棧”,因為它類似于現實世界中的堆棧——一堆盤子。
堆棧操作
下面給出了可以在堆棧上執行的 2 個基本操作。
- Push:將一個元素插入到棧頂。
- Pop:刪除最上面的元素并返回。
此外,還為堆棧提供了以下附加函數以檢查其狀態。
- Peek:返回棧頂元素而不刪除它。
- isEmpty:檢查堆棧是否為空。
- isFull:檢查堆棧是否已滿。
棧的應用
- 用于表達式求值(例如:用于解析和求值數學表達式的調車場算法)。
- 用于實現遞歸編程中的函數調用。
4、隊列(Queues)
隊列是一種FIFO(先進先出——先放置的元素可以先訪問)結構,在許多編程語言中都很常見。這種結構被命名為“隊列”,因為它類似于現實世界的隊列——人們在隊列中等待。
隊列操作
下面給出了可以在隊列上執行的 2 個基本操作。
- Enqueue:將一個元素插入到隊列末尾。
- Dequeue:從隊列開頭刪除元素。
隊列的應用
- 用于管理多線程中的線程。
- 用于實現排隊系統(例如:優先級隊列)。
5、哈希表(Hash Tables)
哈希表是一種存儲值的數據結構,這些值具有與每個值關聯的鍵。此外,如果我們知道與值關聯的鍵,它就可以有效地支持查找。因此,無論數據大小如何,插入和搜索都非常有效。
直接尋址在表中存儲時使用值和鍵之間的一對一映射。但是,當存在大量鍵值對時,這種方法會出現問題。該表將非常龐大,包含如此多的記錄,并且考慮到典型計算機上的可用內存,可能不切實際甚至不可能進行存儲。為了避免這個問題,我們使用哈希表。
哈希函數
稱為散列函數(h)的特殊函數用于克服直接尋址中的上述問題。
在直接訪問中,具有鍵k的值存儲在槽k中。使用哈希函數,我們計算每個值所在的表(槽)的索引。使用哈希函數對給定鍵計算出的值稱為哈希值,它指示該值映射到的表的索引。
h(k) = k % m
- h:哈希函數。
- k:需要確定哈希值的Key。
- m:哈希表的大小(可用槽的數量)。對于m來說,不接近 2 的精確冪的素數是一個不錯的選擇。
考慮哈希函數h(k) = k % 20,其中哈希表的大小為 20。給定一組鍵,我們要計算每個鍵的哈希值,以確定它在哈希表中應位于的索引。考慮我們有以下鍵、哈希和哈希表索引。
- 1 → 1%20 → 1
- 5 → 5%20 → 5
- 23 → 23%20 → 3
- 63 → 63%20 → 3
從上面給出的最后兩個示例中,我們可以看到,當哈希函數為多個鍵生成相同的索引時,可能會出現沖突。我們可以通過選擇合適的哈希函數 h 并使用鏈接和開放尋址等技術來解決沖突。
哈希表的應用
- 用于實現數據庫索引。
- 用于實現關聯數組。
- 用于實現“集合”數據結構。
6、樹(Trees)
樹是一種層次結構,其中數據按層次結構組織并鏈接在一起。這種結構與鏈表不同,而在鏈表中,項目以線性順序鏈接。
在程序的應用中,為了適應某些應用并滿足某些限制,已經開發了各種類型的樹木。一些例子是二叉搜索樹、B樹、treap、紅黑樹、splay樹、AVL樹和n叉樹。
二叉搜索樹
二叉搜索樹(BST),顧名思義,是一種二叉樹,其中數據以層次結構組織。該數據結構按排序順序存儲值。
二叉搜索樹中的每個節點都包含以下屬性。
- key:存儲在節點中的值。
- left:指向左孩子的指針。
- right:指向右孩子的指針。
- p:指向父節點的指針。
二叉搜索樹具有區別于其他樹的獨特屬性。該屬性稱為二叉搜索樹屬性。
令x為二叉搜索樹中的一個節點。
- 如果y是x左子樹中的節點,則y.key ≤ x.key。
- 如果y是x右子樹中的節點,則y.key ≥ x.key。
樹的應用
- 二叉樹:用于實現表達式解析器和表達式求解器。
- 二叉搜索樹:用于許多數據不斷進入和離開的搜索應用程序。
- 堆:JVM(JAVA 虛擬機)用來存儲 Java 對象。
- Treaps:用于無線網絡。
7、堆(Heaps)
堆是二叉樹的一種特殊情況,其中父節點與其子節點的值進行比較,并進行相應的排列。
讓我們看看如何表示堆。堆可以使用樹和數組來表示。下面兩張圖顯示了如何使用二叉樹和數組來表示二叉堆。
堆可以有兩種類型
- 最小堆— 父級的鍵小于或等于其子級的鍵。這稱為最小堆屬性。根將包含堆的最小值。
- 最大堆— 父級的鍵大于或等于其子級的鍵。這稱為最大堆屬性。根將包含堆的最大值。
堆的應用
- 用于堆排序算法。
- 用于實現優先級隊列,因為可以根據堆屬性對優先級值進行排序,其中堆可以使用數組來實現。
- 隊列函數可以在O(log n)時間內使用堆實現。
- 用于查找給定數組中 k?? 的最小(或最大)值。
8、圖表(Graphs)
圖由一組有限的頂點或節點以及一組連接這些頂點的邊組成。
圖的階數是圖中頂點的數量。圖的大小是圖中邊的數量。
如果兩個節點通過同一條邊相互連接,則稱它們是相鄰的。
有向圖
如果圖G的所有邊都具有指示起始頂點和終止頂點的方向,則稱圖 G 是有向圖。
我們說(u, v)是從頂點u入射或離開頂點u ,并且是從頂點 v 入射或進入頂點v。
自循環:從頂點到自身的邊。
無向圖
如果圖G的所有邊都沒有方向,則稱其為無向圖。它可以在兩個頂點之間雙向移動。
如果一個頂點沒有連接到圖中的任何其他節點,則稱該頂點是孤立的。
圖的應用
- 用于表示社交媒體網絡。每個用戶都是一個頂點,當用戶連接時,他們會創建一條邊。
- 用于表示搜索引擎的網頁和鏈接。互聯網上的網頁通過超鏈接相互鏈接。每個頁面是一個頂點,兩個頁面之間的超鏈接是一條邊。用于百度中的頁面排名。
- 用于表示 GPS 中的位置和路線。位置是頂點,連接位置的路線是邊。用于計算兩個位置之間的最短路線。
總結
還有很多種數據結構,其實都是基于以上數據結構變種生成的,數據結構是每個程序員都要掌握的,無論是工作中還是面試都必不可少的知識儲備。