導讀:InnoDB是事務安全的MySQL存儲引擎,設計上采用了類似于Oracle數據庫的架構。通常來說,InnoDB存儲引擎是OLTP應用中核心表的首選存儲引擎。同時,也正是因為InnoDB的存在,才使MySQL數據庫變得更有魅力。
本文將簡要介紹InnoDB存儲引擎的體系架構及其不同于其他存儲引擎的特性。
作者:姜承堯
來源:華章科技
01 InnoDB存儲引擎概述
InnoDB存儲引擎最早由Innobase Oy公司開發,被包括在MySQL數據庫所有的二進制發行版本中,從MySQL 5.5版本開始是默認的表存儲引擎(之前的版本InnoDB存儲引擎僅在windows下為默認的存儲引擎)。
該存儲引擎是第一個完整支持ACID事務的MySQL存儲引擎(BDB是第一個支持事務的MySQL存儲引擎,現在已經停止開發),其特點是行鎖設計、支持MVCC、支持外鍵、提供一致性非鎖定讀,同時被設計用來最有效地利用以及使用內存和CPU。
Heikki Tuuri是InnoDB存儲引擎的創始人,和著名的linux創始人Linus是芬蘭赫爾辛基大學校友。在1990年獲得赫爾辛基大學的數學邏輯博士學位后,他于1995年成立Innobase Oy公司并擔任CEO。
同時,在InnoDB存儲引擎的開發團隊中,有來自中國科技大學的Calvin Sun。隨后又有一個中國人Jimmy Yang也加入了InnoDB存儲引擎的核心開發團隊,負責全文索引的開發,其之前任職于Sybase數據庫公司,負責數據庫的相關開發工作。
InnoDB存儲引擎已經被許多大型網站使用,如用戶熟知的google、Yahoo!、Facebook、YouTube、Flickr,在網絡游戲領域有《魔獸世界》《Second Life》《神兵玄奇》等。我不是MySQL數據庫的布道者,也不是InnoDB的鼓吹者,但是我認為當前實施一個新的OLTP項目不使用MySQL InnoDB存儲引擎將是多么的愚蠢。
從MySQL數據庫的官方手冊可得知,著名的Internet新聞站點Slashdot.org運行在InnoDB上。Mytrix、Inc.在InnoDB上存儲超過1TB的數據,還有一些其他站點在InnoDB上處理插入/更新操作的速度平均為800次/秒。這些都證明了InnoDB是一個高性能、高可用、高可擴展的存儲引擎。
InnoDB存儲引擎同MySQL數據庫一樣,在GNU GPL 2下發行。更多有關MySQL證書的信息,這里不再詳細介紹,可參考:
http://www.mysql.com/about/legal/
02 InnoDB存儲引擎的版本
InnoDB存儲引擎被包含于所有MySQL數據庫的二進制發行版本中。早期其版本隨著MySQL數據庫的更新而更新。從MySQL 5.1版本時,MySQL數據庫允許存儲引擎開發商以動態方式加載引擎,這樣存儲引擎的更新可以不受MySQL數據庫版本的限制。
所以在MySQL 5.1中,可以支持兩個版本的InnoDB,一個是靜態編譯的InnoDB版本,可將其視為老版本的InnoDB;另一個是動態加載的InnoDB版本,官方稱為InnoDB Plugin,可將其視為InnoDB 1.0.x版本。
MySQL 5.5版本中又將InnoDB的版本升級到了1.1.x。而在MySQL 5.6版本中InnoDB的版本也隨著升級為1.2.x版本。
以下是InnoDB各版本功能對比。
- 老版本InnoDB:支持ACID、行鎖設計、MVCC
- InnoDB 1.0.x:繼承了上述版本所有功能,增加了compress和dynamic頁格式
- InnoDB 1.1.x:繼承了上述版本所有功能,增加了Linux AIO、多回滾段
- InnoDB 1.2.x:繼承了上述版本所有功能,增加了全文索引支持、在線索引添加
在現實工作中我發現很多MySQL數據庫還是停留在MySQL 5.1版本,并使用InnoDB Plugin。很多DBA錯誤地認為InnoDB Plugin和InnoDB 1.1版本之間是沒有區別的。但從功能對比中還是可以發現,雖然都增加了對于compress和dynamic頁的支持,但是InnoDB Plugin是不支持Linux Native AIO功能的。
此外,由于不支持多回滾段,InnoDB Plugin支持的最大支持并發事務數量也被限制在1023。而且隨著MySQL 5.5版本的發布,InnoDB Plugin也變成了一個歷史產品。
03 InnoDB體系架構
圖2-1簡單顯示了InnoDB的存儲引擎的體系架構,從圖可見,InnoDB存儲引擎有多個內存塊,可以認為這些內存塊組成了一個大的內存池,負責如下工作:
- 維護所有進程/線程需要訪問的多個內部數據結構。
- 緩存磁盤上的數據,方便快速地讀取,同時在對磁盤文件的數據修改之前在這里緩存。
- 重做日志(redo log)緩沖。
……
▲圖2-1 InnoDB存儲引擎體系架構
后臺線程的主要作用是負責刷新內存池中的數據,保證緩沖池中的內存緩存的是最近的數據。此外將已修改的數據文件刷新到磁盤文件,同時保證在數據庫發生異常的情況下InnoDB能恢復到正常運行狀態。
InnoDB存儲引擎是多線程的模型,因此其后臺有多個不同的后臺線程,負責處理不同的任務。
InnoDB存儲引擎是基于磁盤存儲的,并將其中的記錄按照頁的方式進行管理。因此可將其視為基于磁盤的數據庫系統(Disk-base Database)。在數據庫系統中,由于CPU速度與磁盤速度之間的鴻溝,基于磁盤的數據庫系統通常使用緩沖池技術來提高數據庫的整體性能。
緩沖池簡單來說就是一塊內存區域,通過內存的速度來彌補磁盤速度較慢對數據庫性能的影響。
在數據庫中進行讀取頁的操作,首先將從磁盤讀到的頁存放在緩沖池中,這個過程稱為將頁“FIX”在緩沖池中。下一次再讀相同的頁時,首先判斷該頁是否在緩沖池中。若在緩沖池中,稱該頁在緩沖池中被命中,直接讀取該頁。否則,讀取磁盤上的頁。
▲圖2-2 InnoDB內存數據對象
通常來說,數據庫中的緩沖池是通過LRU(Latest Recent Used,最近最少使用)算法來進行管理的。即最頻繁使用的頁在LRU列表的前端,而最少使用的頁在LRU列表的尾端。當緩沖池不能存放新讀取到的頁時,將首先釋放LRU列表中尾端的頁。
04 InnoDB關鍵特性
InnoDB存儲引擎的關鍵特性包括:
- 插入緩沖(Insert Buffer)
- 兩次寫(Double Write)
- 自適應哈希索引(Adaptive Hash Index)
- 異步IO(Async IO)
- 刷新鄰接頁(Flush Neighbor Page)
上述這些特性為InnoDB存儲引擎帶來更好的性能以及更高的可靠性。
關于作者:姜承堯(David Jiang),資深MySQL數據庫專家,擅長于數據庫的故障診斷、性能調優、容災處理、高可用和高擴展研究,同時一直致力于MySQL數據庫底層實現原理的研究和探索。此外,對高性能數據庫和數據倉庫也有深刻而獨到的理解。曾為MySQL編寫了許多開源工具和性能擴展補丁,如廣受好評的InnoDB引擎二級緩存項目。
本文摘編自《MySQL技術內幕:InnoDB存儲引擎(第2版)》,經出版方授權發布。