在馮小剛馮導(dǎo)作為導(dǎo)演拍攝的《天下無賊》中有一句經(jīng)典臺(tái)詞,那就是出自葛優(yōu)之口:21世紀(jì)什么最貴?人才!從這句話說出到現(xiàn)在,已經(jīng)16年過去了,那么在現(xiàn)在這個(gè)大數(shù)據(jù)時(shí)代,什么最貴呢?那就是數(shù)據(jù)!做好數(shù)據(jù)管理是首要的大事,而在數(shù)據(jù)管理方面,數(shù)據(jù)庫是最好的依托。那個(gè)手寫數(shù)據(jù),人工查閱的年代已經(jīng)過去很久遠(yuǎn)了!
數(shù)據(jù)庫的分類,可以簡(jiǎn)要的分為關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫,對(duì)應(yīng)的數(shù)據(jù)就是結(jié)構(gòu)化的數(shù)據(jù)和非結(jié)構(gòu)化的數(shù)據(jù),主要作用就是存儲(chǔ)和管理數(shù)據(jù),現(xiàn)在市面上有很多成熟的數(shù)據(jù)庫產(chǎn)品,像關(guān)系型數(shù)據(jù)庫:Oracle、MySQL、sql server、Postgre等,非關(guān)系型數(shù)據(jù)庫redis、MongoDB等,面向列存儲(chǔ)的數(shù)據(jù)庫Hbase和圖形存儲(chǔ)數(shù)據(jù)庫Neo4j等,今天這篇分享就以Mysql數(shù)據(jù)庫為例,講解一下數(shù)據(jù)庫當(dāng)中的索引。
MySQL是一種關(guān)系數(shù)據(jù)庫管理系統(tǒng),關(guān)系數(shù)據(jù)庫將數(shù)據(jù)保存在不同的表中,而不是將所有數(shù)據(jù)放在一個(gè)大倉庫內(nèi),這樣就增加了速度并提高了靈活性。在 WEB應(yīng)用方面,MySQL是最好的 RDBMS 應(yīng)用軟件之一。要想挖掘MySQL作為數(shù)據(jù)庫的強(qiáng)大功能,就要學(xué)好怎么利用索引來提高查詢響應(yīng)速度,通過給字段添加索引可以提高數(shù)據(jù)的讀取速度,提高項(xiàng)目的并發(fā)能力和抗壓能力。索引優(yōu)化時(shí)mysql中的一種優(yōu)化方式。索引的作用相當(dāng)于圖書的目錄,可以根據(jù)目錄中的頁碼快速找到所需的內(nèi)容。
一般來說,索引本身也很大,不可能全部存儲(chǔ)在內(nèi)存中,因此索引往往以索引文件的形式存儲(chǔ)的磁盤上。這樣的話,索引查找過程中就要產(chǎn)生磁盤I/O消耗,相對(duì)于內(nèi)存存取,I/O存取的消耗要高幾個(gè)數(shù)量級(jí)。所以評(píng)價(jià)一個(gè)數(shù)據(jù)結(jié)構(gòu)作為索引的優(yōu)劣最重要的指標(biāo)就是在查找過程中磁盤I/O操作次數(shù)的漸進(jìn)復(fù)雜度。也就是說,索引的結(jié)構(gòu)組織要盡量減少查找過程中磁盤I/O的存取次數(shù)。
從上圖中可以看出,MySQL的存儲(chǔ)引擎默認(rèn)是InnoDB,而InnoDB中的索引使用B+Tree實(shí)現(xiàn)的,這個(gè)數(shù)據(jù)結(jié)構(gòu)能夠很好的減少查找過程中磁盤I/O的存取次數(shù),從而使得MySQL的查詢性能提高好幾個(gè)數(shù)量級(jí),關(guān)于索引的分類,一般分為下面幾類:
主鍵索引(PRIMARY):
ALTER TABLE `table_name` ADD PRIMARY KEY ( `column` )
唯一索引(UNIQUE):
ALTER TABLE `table_name` ADD UNIQUE (`column`)
聯(lián)合索引(INDEX):
ALTER TABLE `table_name` ADD INDEX index_name ( `column1`, `column2`, `column3` )
普通索引(INDEX):
ALTER TABLE `table_name` ADD INDEX index_name ( `column` )
全文索引(FULLTEXT):
ALTER TABLE `table_name` ADD FULLTEXT ( `column` )
主鍵索引是一個(gè)表中只有一個(gè)主鍵索引,不允許為null,而唯一索引是一個(gè)表中可以有多個(gè)唯一索引,但是這列的值要唯一,允許值為null,聯(lián)合索引就是對(duì)多個(gè)列建立索引,這里面要注意最左匹配原則,普通索引就是對(duì)表中一列建立索引,沒有什么限制,而全文索引一般用于檢索文本時(shí)使用,一般用于模糊查詢。
下面就來看一下這些索引的應(yīng)用,先來創(chuàng)建一個(gè)用戶表:
CREATE TABLE `tb_user` ( `id` BIGINT (20), `user_name` VARCHAR (200), `user_password` VARCHAR (200), `birth` DATETIME , `sex` CHAR (4), `age` int(8), `email` VARCHAR (200), `mobile` VARCHAR (200), `create_date` DATETIME , `update_date` DATETIME , `description` VARCHAR (800) ) ENGINE=INNODB;
寫一個(gè)存儲(chǔ)過程,向里面插入一百萬條數(shù)據(jù)用來測(cè)試:
DELIMITER $$ CREATE PROCEDURE insert_tb_user() BEGIN DECLARE i INT; SET i=0; WHILE i>=0 && i<= 1000000 DO INSERT INTO tb_user (`id`, `user_name`, `user_password`, `birth`, `sex`, `age`, `email`, `mobile`, `create_date`, `update_date`, `description`) VALUES (i,'admin','123456',NOW(),'M',i,'admin@qq.com','12345678123',NOW(),NOW(),'超級(jí)管理員'); SET i=i + 1; END WHILE; END$$ DELIMITER ;
執(zhí)行存儲(chǔ)過程:
call insert_tb_user()
利用下面的語句將里面的值更改一下,要不都是一樣的:
update tb_user a set a.user_name=concat('admin', id); update tb_user a set a.user_password=concat('admin', id); update tb_user a set a.mobile=concat('12345', id);
或者在存儲(chǔ)過程中加上這些函數(shù)處理,使每一行的值都不一樣!一百萬條數(shù)據(jù)建好后,如下顯示:
要測(cè)試是否使用索引對(duì)查詢速度的影響,首先要把查詢緩存給關(guān)掉,要不下次查詢走了緩存,就對(duì)索引測(cè)試有影響了,如下,查詢緩存已經(jīng)關(guān)閉了:
我們使用語句show index from tb_user來查詢現(xiàn)在表中建立索引的情況,發(fā)現(xiàn)現(xiàn)在一個(gè)索引也沒有:
這時(shí)我們來查詢一下:
通過主鍵來查詢,才一百萬條數(shù)據(jù),就已經(jīng)耗時(shí)將近1秒了,這是不能忍的,對(duì)于主鍵,我們來建立主鍵索引,看查詢速度有什么變化:
建立主鍵索引耗時(shí)5.4秒,耗時(shí)這么久是因?yàn)橐⑺饕龢洌簿褪荁+Tree。運(yùn)行剛才那一條查詢語句:
就在那一瞬間,數(shù)據(jù)就被查詢出來了,效率高低一竿見影呀!
對(duì)用戶名建立唯一索引,語句為ALTER TABLE tb_user ADD UNIQUE KEY (user_name):
保存了,重復(fù)的值,這是因?yàn)槲腋牧似渲械囊粋€(gè)用戶名,來驗(yàn)證唯一索引對(duì)改列值唯一性的要求。把值改回來再重新建立唯一索引:
聯(lián)合索引、普通索引和全文索引,按照上面寫的建立索引的語句,都可以正確的為每列建立索引,大家動(dòng)手試一下把!