哈嘍,大家好,我是了不起。面試的時候,面試官總喜歡問一些關于MySQL索引的問題,但是如果單純的記憶,還是有難度的;今天了不起把MySQL索引的知識點進行匯總,方便大家快速記憶MySQL索引的相關知識點。趕快收藏此文章吧!
索引結構:B+樹
索引其實是一種數據結構
注意B+樹是MySQL,索引默認的結構;一張表至少有一個索引(主鍵索引),是可以有多個索引的
MySQL中的B+Tree
- 非葉子節點也叫內部節點,只存儲 健值(主鍵的值) + 指針(存儲子節點的地址信息)
主鍵索引:健值(主鍵的值) + 指針(存儲子節點的地址信息)
非主鍵索引:非主鍵列的值 + 指向下一個節點的指針(存儲子節點的地址信息)
- 所有的數據都存在葉子節點中;
-
同時葉子節點上還存有一個指向相鄰葉子節點的指針
-
如果是聚簇索引(主鍵索引),葉子節點存儲的是實際數據
-
如果是非聚簇索引,則保存的是聚簇索引的索引key,也就是主鍵索引的值;查詢非聚簇索引會有一個回表操作
-
B+Tree的每個葉子節點增加了一個指向相鄰葉子節點的指針,它的最后一個數據會指向下一個葉子節點的第一個數據,形成了一個有序鏈表的結構。
為什么B+ 樹比B 樹更適合作為索引?
- B+ 樹的磁盤讀寫代價更低 B+ 樹的數據都集中在葉子節點,分支節點 只負責指針(索引);B 樹的分支節點既有指針也有數據 。這將導致B+ 樹的層高會小于B 樹的層高,也就是說B+ 樹平均的Io次數會小于B 樹。
- B+ 樹的查詢效率更加穩定 B+ 樹的數據都存放在葉子節點,故任何關鍵字的查找必須走一條從根節點到葉子節點的路徑。所有關鍵字的查詢路徑相同,每個數據查詢效率相當。
- B+樹更便于遍歷 由于B+樹的數據都存儲在葉子結點中,分支結點均為索引,遍歷只需要掃描一遍葉子節點即可;B樹因為其分支結點同樣存儲著數據,要找到具體的數據,需要進行一次中序遍歷按序來搜索。
- B+樹更擅長范圍查詢 B+樹葉子節點存放數據,數據是按順序放置的雙向鏈表。B樹范圍查詢只能中序遍歷。
- B+ 樹占用內存空間小 B+ 樹索引節點沒有數據,比較小。在內存有限的情況下,相比于B樹索引可以加載更多B+ 樹索引。
MyISAM與InnoDB 的區別
- InnoDB支持事務,MyISAM不支持
- InnoDB支持外鍵,而MyISAM不支持
- InnoDB是聚集索引,數據和索引存到同一個文件里;MyISAM是非聚集索引,數據和索引不在同一個文件里;都是使用B+Tree作為索引結構
- InnoDB不保存表的具體行數,執行select count(*) from table時需要全表掃描。而MyISAM用一個變量保存了整個表的行數,執行上述語句時只需要讀出該變量即可,速度很快(注意不能加有任何WHERE條件)
因為InnoDB的事務特性,在同一時刻表中的行數對于不同的事務而言是不一樣的,因此count統計會計算對于當前事務而言可以統計到的行數,而不是將總行數儲存起來方便快速查詢。InnoDB會嘗試遍歷一個盡可能小的索引除非優化器提示使用別的索引。如果二級索引不存在,InnoDB還會嘗試去遍歷其他聚簇索引。
如果索引并沒有完全處于InnoDB維護的緩沖區(Buffer Pool)中,count操作會比較費時。可以建立一個記錄總行數的表并讓你的程序在INSERT/DELETE時更新對應的數據。和上面提到的問題一樣,如果此時存在多個事務的話這種方案也不太好用。如果得到大致的行數值已經足夠滿足需求可以嘗試SHOW TABLE STATUS
那么為什么InnoDB沒有了這個變量呢?
- InnoDB支持表、行(默認)級鎖,而MyISAM僅支持表級鎖
- InnoDB表必須有唯一索引(如主鍵)(用戶沒有指定的話會自己找/生產一個隱藏列Row_id來充當默認主鍵),而Myisam可以沒有主鍵
- Innodb存儲文件有frm、ibd,而Myisam是frm、MYD、MYI
-
Innodb:frm是表定義文件,ibd是數據文件
-
Myisam:frm是表定義文件,myd是數據文件,myi是索引文件
索引失效的場景
- 對索引列使用了函數、表達式或運算符:當查詢條件中使用了函數、表達式或運算符時,MySQL就無法使用該列的索引,因為它需要對每行數據進行計算,而不是直接查找索引。
- 查詢條件中使用了不等于操作符(<>、!=)、NOT NULL, NOT IN 等
- 模糊查詢:當查詢條件中使用了LIKE、%或_等模糊匹配符號時,MySQL無法使用索引進行快速定位。
- OR條件:當查詢條件中包含多個OR條件時,MySQL無法使用索引進行快速定位。
- 范圍查詢:當查詢條件中使用了BETWEEN、<、>、<=、>=等操作符時,MySQL只能使用索引中的一部分數據,需要讀取更多的數據進行過濾,降低了查詢效率。
- 數據類型不匹配,需要隱式轉換類型
- 對索引列進行排序,因為它需要將數據按照指定的順序進行排序
- 復合索引,如果不使用前列,后續列也將無法使用
小結
正確的使用索引,能夠顯著提高數據庫的查詢效率。本文匯總了MySQL索引的常用知識點,幫助大家快速記憶,快快收藏吧。