很多同學在面試中會被問到數據庫的問題,而常被問到的一個問題就是:
MySQL 中的 InnoDB 和 MyISAM 之間是什么關系,分別有什么特點?
許多同學都把 MySQL 作為自己的數據庫,但是可能用過最多的就是 SQL 語句,以及一些 ORM 的寫法,而對底層的實現了解甚少,比如上述問題中,InnoDB 和 MyISAM 分別是什么,可能都不是非常清楚。然而在一些大型公司(比如騰訊)的面試題中,可能會高頻率地出現這類的問題,所以對于這類問題的正確理解,就顯得非常重要了。
其實 InnoDB 和 MyISAM 是 MySQL 的兩個「存儲引擎」。
下面我將詳細闡述一下這兩者之間的聯系和區別。
數據庫存儲引擎
數據庫存儲引擎是數據庫底層軟件組織,數據庫管理系統(DBMS)使用數據引擎進行創建、查詢、更新和刪除數據。不同的存儲引擎提供不同的存儲機制、索引技巧、鎖定水平等功能,使用不同的存儲引擎,還可以獲得特定的功能。
如何知道自己的數據庫用的什么引擎呢?
SHOW ENGINES;
我們可以看出數據庫為我們提供了非常多的存儲引擎,從表中看出,InnoDB 的 Support 列是 DEFAULT,表明在我的數據庫服務器上,InnoDB 是默認的數據庫引擎,不過 MySQL 對于多引擎有很好的兼容,一個數據庫服務器上不同的數據庫完全可以使用不同的數據引擎,甚至一個數據庫中的多個表也可以使用不同的引擎。
從一些文檔中我們可以總結出這兩個引擎的一些差異:
- InnoDB 支持事務,MyISAM 不支持,對于 InnoDB 每一條 SQL 語句都默認封裝成事務進行提交,這樣就會影響速度,優化速度的方式是將多條 SQL 語句放在 begin 和 commit 之間,組成一個事務;
- InnoDB 支持外鍵,而 MyISAM 不支持。
所以如果一個表修改要求比較高的事務處理,可以選擇 InnoDB。這個數據庫中可以將查詢要求比較高的表選擇 MyISAM 存儲。如果該數據庫需要一個用于查詢的臨時表,甚至可以考慮選擇 MEMORY 存儲引擎。
但是為什么 InnoDB 和 MyISAM 之間會有這些差異呢?我們需要了解一下對應的儲存引擎的底層原理。
?
存儲引擎原理
首先針對可能面試會問到的問題「MyISAM 和 InnoDB 兩種引擎所使用的索引的數據結構是什么」做一個回答:
都是 B+ 樹,不過區別在于:
- MyISAM 中 B+ 樹的數據結構存儲的內容是實際數據的地址值,它的索引和實際數據是分開的,只不過使用索引指向了實際數據。這種索引的模式被稱為非聚集索引。
- InnoDB 中 B+ 樹的數據結構中存儲的都是實際的數據,這種索引有被稱為聚集索引。
B 樹和 B+ 樹
那么什么是 B+ 樹?
B+ 樹是 B 樹的一個變種,對于 B 樹來說:
B 樹屬于多叉樹又名平衡多路查找樹,其規則是:
- 所有節點關鍵字是按遞增次序排列,并遵循左小右大原則
- 子節點數:非葉節點的子節點數>1,且<=M ,且M>=2,空樹除外(注:M階代表一個樹節點最多有多少個查找路徑,M=M 路,當 M=2 則是 2 叉樹,M=3 則是 3 叉)
- 關鍵字數:枝節點的關鍵字數量大于等于 ceil(m/2)-1 個且小于等于 M-1 個(注:ceil() 是個朝正無窮方向取整的函數 如 ceil(1.1)結果為 2)
- 葉節點的指針為空且葉節點具有相同的深度
而對于 B+ 樹:
B+ 樹是 B 樹的一個升級版,相對于 B 樹來說 B+ 樹更充分的利用了節點的空間,讓查詢速度更加穩定,其速度完全接近于二分法查找。
一個 B+ 樹的 C++ 定義類似如下:
?
什么是索引
由于以上實現的數據結構與數據庫中索引相關,關于索引,有以下知識:
- 唯一索引:唯一索引不允許兩行具有相同的索引值
- 主鍵索引:為表定義一個主鍵將自動創建主鍵索引,主鍵索引是唯一索引的特殊類型。主鍵索引要求主鍵中的每個值是唯一的,并且不能為空
- 聚集索引(Clustered):表中各行的物理順序與鍵值的邏輯(索引)順序相同,每個表只能有一個
- 非聚集索引(Non-clustered):非聚集索引指定表的邏輯順序。數據存儲在一個位置,索引存儲在另一個位置,索引中包含指向數據存儲位置的指針。可以有多個,小于 249 個
MyISAM
回到 MyISAM,其索引結構如下圖所示,由于 MyISAM 的索引文件僅僅保存數據記錄的地址。在 MyISAM 中,主索引和輔助索引(Secondary key)在結構上沒有任何區別:
MyISAM 中索引檢索的算法為首先按照 B+Tree 搜索算法搜索索引,如果指定的 Key 存在,則取出其 data 域的值,然后以 data 域的值為地址,讀取相應數據記錄。
InnoDB
對于 InnoDB 來說,表數據文件本身就是按 B+Tree 組織的一個索引結構,這棵樹的葉節點 data 域保存了完整的數據記錄。
由于 InnoDB 利用的數據庫主鍵作為索引 Key,所以 InnoDB 數據表文件本身就是主索引,且因為 InnoDB 數據文件需要按照主鍵聚集,所以使用 InnoDB 作為數據引擎的表需要有個主鍵,如果沒有顯式指定的話 MySQL 會嘗試自動選擇一個可以唯一標識數據的列作為主鍵,如果無法找到,則會生成一個隱含字段作為主鍵,這個字段長度為6個字節,類型為長整形。
小結
對于面試題來說,一般只會被要求回答到 InnoDB 和 MyISAM 在使用上的區別,不過如果需要深究一下為什么會有那些區別的話,就需要了解其底層的實現原理,順便還需要對于 B+ 樹有一定的了解,相信讀者在讀完本文后已經可以比較清晰地了解其背后的原理概要了,離拿到希望的 Offer 又近了一步。
本文作者:Nova Kwok
聲明:本文歸 “力扣” 版權所有,如需轉載請聯系。
文中部分圖片來源于網絡,為非商業用途使用,如有侵權聯系刪除。