概述
今天主要分享一下MySQL的數(shù)據(jù)庫規(guī)范,僅供參考。從基礎、命名、表設計、字段設計、索引設計、sql編寫、行為規(guī)范幾個方面做介紹。
基礎規(guī)范
1、必須使用InnoDB存儲引擎
說明:支持事務、行級鎖、并發(fā)性能更好、CPU及內存緩存頁優(yōu)化使得資源利用率更高
2、新庫使用utf8mb4字符集
說明:萬國碼,無需轉碼,無亂碼風險,節(jié)省空間
3、數(shù)據(jù)表、數(shù)據(jù)字段必須加入中文注釋
說明:主要是避免離職后沒人知道這些字段是什么意思
4、禁止使用存儲過程、視圖、觸發(fā)器、Event
說明:高并發(fā)大數(shù)據(jù)的互聯(lián)網(wǎng)業(yè)務,架構設計思路是“解放數(shù)據(jù)庫CPU,將計算轉移到服務層”,并發(fā)量大的情況下,這些功能很可能將數(shù)據(jù)庫拖死,業(yè)務邏輯放到服務層具備更好的擴展性,能夠輕易實現(xiàn)“增機器就加性能”。數(shù)據(jù)庫擅長存儲與索引,CPU計算還是上移吧。
5、禁止存儲大文件或者大照片
說明:為何要讓數(shù)據(jù)庫做它不擅長的事情?大文件和照片存儲在文件系統(tǒng),數(shù)據(jù)庫里更多是用來存URI。
命名規(guī)范
1、只允許使用內網(wǎng)域名,而不是ip連接數(shù)據(jù)庫
- 線上環(huán)境、開發(fā)環(huán)境、測試環(huán)境數(shù)據(jù)庫內網(wǎng)域名遵循命名規(guī)范
- 業(yè)務名稱:xxx
- 線上環(huán)境:dj.xxx.db
- 開發(fā)環(huán)境:dj.xxx.rdb
- 測試環(huán)境:dj.xxx.tdb
- 從庫在名稱后加-s標識,備庫在名稱后加-ss標識
- 線上從庫:dj.xxx-s.db
- 線上備庫:dj.xxx-sss.db
2、庫名、表名、字段名:小寫,下劃線風格,不超過32個字符,必須見名知意,禁止拼音英文混用
- 表名t_xxx,非唯一索引名idx_xxx,唯一索引名uniq_xxx
表設計規(guī)范
1、單實例表數(shù)目必須小于500,單表列數(shù)目必須小于30,表必須有主鍵,例如自增主鍵
說明:
- 1)主鍵遞增,數(shù)據(jù)行寫入可以提高插入性能,可以避免page分裂,減少表碎片提升空間和內存的使用
- 2)主鍵要選擇較短的數(shù)據(jù)類型, Innodb引擎普通索引都會保存主鍵的值,較短的數(shù)據(jù)類型可以有效的減少索引的磁盤空間,提高索引的緩存效率
- 3) 無主鍵的表刪除,在row模式的主從架構,會導致備庫夯住
2、禁止使用外鍵,如果有外鍵完整性約束,需要應用程序控制
說明:外鍵會導致表與表之間耦合,update與delete操作都會涉及相關聯(lián)的表,十分影響sql 的性能,甚至會造成死鎖。高并發(fā)情況下容易造成數(shù)據(jù)庫性能,大數(shù)據(jù)高并發(fā)業(yè)務場景數(shù)據(jù)庫使用以性能優(yōu)先。
字段設計規(guī)范
1、必須把字段定義為NOT NULL并且提供默認值
說明:
- 1)null的列使索引/索引統(tǒng)計/值比較都更加復雜,對MySQL來說更難優(yōu)化
- 2)null 這種類型MySQL內部需要進行特殊處理,增加數(shù)據(jù)庫處理記錄的復雜性;同等條件下,表中有較多空字段的時候,數(shù)據(jù)庫的處理性能會降低很多
- 3)null值需要更多的存儲空,無論是表還是索引中每行中的null的列都需要額外的空間來標識
- 4)對null 的處理時候,只能采用is null或is not null,而不能采用=、in、<、<>、!=、not in這些操作符號。如:where name!=’shenjian’,如果存在name為null值的記錄,查詢結果就不會包含name為null值的記錄
2、禁止使用TEXT、BLOB類型
說明:會浪費更多的磁盤和內存空間,非必要的大量的大字段查詢會淘汰掉熱數(shù)據(jù),導致內存命中率急劇降低,影響數(shù)據(jù)庫性能
3、禁止使用小數(shù)存儲貨幣
說明:使用整數(shù)吧,小數(shù)容易導致金額對不上
4、必須使用varchar(20)存儲手機號
說明:
- 1)涉及到區(qū)號或者國家代號,可能出現(xiàn)+-()
- 2)手機號會去做數(shù)學運算么?
- 3)varchar可以支持模糊查詢,例如:like“138%”
5、禁止使用ENUM,可使用TINYINT代替
說明:
- 1)增加新的ENUM值要做DDL操作
- 2)ENUM的內部實際存儲就是整數(shù)
索引設計規(guī)范
1、單表索引建議控制在5個以內
說明:字段超過5個時,實際已經(jīng)起不到有效過濾數(shù)據(jù)的作用了
2、禁止在更新十分頻繁、區(qū)分度不高的屬性上建立索引
說明:
- 1)更新會變更B+樹,更新頻繁的字段建立索引會大大降低數(shù)據(jù)庫性能
- 2)“性別”這種區(qū)分度不大的屬性,建立索引是沒有什么意義的,不能有效過濾數(shù)據(jù),性能與全表掃描類似
3、建立組合索引,必須把區(qū)分度高的字段放在前面
說明:能夠更加有效的過濾數(shù)據(jù)
SQL編寫規(guī)范
1、禁止使用SELECT *,只獲取必要的字段,需要顯示說明列屬性
說明:
- 1)讀取不需要的列會增加CPU、IO、NET消耗
- 2)不能有效的利用覆蓋索引
- 3)使用SELECT *容易在增加或者刪除字段后出現(xiàn)程序BUG
2、禁止使用INSERT INTO t_xxx VALUES(xxx),必須顯示指定插入的列屬性
說明:容易在增加或者刪除字段后出現(xiàn)程序BUG
3、禁止使用屬性隱式轉換
說明:SELECT uid FROM t_user WHERE phone=13812345678 會導致全表掃描,而不能命中phone索引,猜猜為什么?(這個線上問題不止出現(xiàn)過一次)
4、禁止在WHERE條件的屬性上使用函數(shù)或者表達式
說明:SELECT uid FROM t_user WHERE from_unixtime(day)>='2017-02-15' 會導致全表掃描 正確的寫法是:SELECT uid FROM t_user WHERE day>= unix_timestamp('2017-02-15 00:00:00')
5、禁止負向查詢,以及%開頭的模糊查詢
說明:
- 1)負向查詢條件:NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等,會導致全表掃描
- 2)%開頭的模糊查詢,會導致全表掃描
6、禁止大表使用JOIN查詢,禁止大表使用子查詢
說明:會產(chǎn)生臨時表,消耗較多內存與CPU,極大影響數(shù)據(jù)庫性能
7、禁止使用OR條件,必須改為IN查詢
說明:舊版本Mysql的OR查詢是不能命中索引的,即使能命中索引,為何要讓數(shù)據(jù)庫耗費更多的CPU幫助實施查詢優(yōu)化呢?
8、應用程序必須捕獲SQL異常,并有相應處理
行為規(guī)范
1、禁止使用應用程序配置文件內的帳號手工訪問線上數(shù)據(jù)庫
2、禁止非DBA對線上數(shù)據(jù)庫進行寫操作,修改線上數(shù)據(jù)需要提交工單,由DBA執(zhí)行,提交的SQL語句必須經(jīng)過測試
3、分配非DBA以只讀帳號,必須通過VPN+跳板機訪問授權的從庫
4、開發(fā)、測試、線上環(huán)境隔離