01. 索引對數據庫性能如此重要,如何使用它?
為數據庫選擇正確的索引是一項復雜的任務。如果索引列較少,則需要的磁盤空間和維護開銷 都較少。如果在一個大表上創建了多種組合索引,索引文件也會膨脹很快。
而另一方面,索引較多,可覆蓋更多的查詢。可能需要試驗若干不同的設計,才能找到最有效的索引。可以添加、修改和刪 除索引而不影響數據庫架構或應用程序設計。因此,應嘗試多個不同的索引從而建立最優的索引。
02. 盡量使用短索引
對字符串類型的字段進行索引,如果可能應該指定一個前綴長度。例如,如果有一個 CHAR(255)的列,如果在前10個或30個字符內,多數值是惟一的,則不需要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁盤空間、減少I/O操作。
03. MySQL存儲過程和函數有什么區別?
在本質上它們都是存儲程序。函數只能通過return語句返回單個值或者表對象;而存儲過程 不允許執行return,但是可以通過out參數返回多個值。函數限制比較多,不能用臨時表,只能用表變量,還有一些函數都不可用等等;而存儲過程的限制相對就比較少。函數可以嵌入在SQL 語句中使用,可以在SELECT語句中作為查詢語句的一個部分調用;而存儲過程一般是作為一個獨立的部分來執行.
04. 存儲過程中的代碼可以改變嗎?
目前,MySQL還不提供對已存在的存儲過程代碼的修改,如果必須要修改存儲過程,必須使用DROP語句刪除之后,再重新編寫代碼,或者創建一個新的存儲過程。
05. 存儲過程中可以調用其他存儲過程嗎?
存儲過程包含用戶定義的SQL語句集合,可以使用CALL語句調用存儲過程,當然在存儲 過程中也可以使用CALL語句調用其他存儲過程,但是不能使用DROP語句刪除其他存儲過程。
06. 存儲參數不要與數據表中的字段名相同
在定義存儲過程參數列表時,應注意把參數名與數據庫表中的字段名區別開來,否則將出 現無法預期的結果。
07. 存儲過程的參數可以使用中文嗎?
一般情況下,可能會出現存儲過程中傳入中文參數的情況,例如某個存儲過程根據用戶的 名字查找該用戶的信息,傳入的參數值可能是中文。這時需要在定義存儲過程的時候,在后面加上character set gbk,不然調用存儲過程使用中文參數會出錯,比如定義userInfo存儲過程,代碼 如下:
CREATE PROCEDURE useInfo(IN u_name VARCHAR(50) character set gbk, OUT u_age INT)
08. MySQL中視圖和表的區別以及聯系?
兩者的區別:
- 視圖是已經編譯好的SQL語句,是基于SQL語句的結果集的可視化的表,而表不是。
- 視圖沒有實際的物理記錄,而基本表有。
- 表是內容,視圖是窗口。
- 表占用物理空間而視圖不占用物理空間,視圖只是邏輯概念的存在,表可以及時對它 進行修改,但視圖只能用創建的語句來修改。
- 視圖是查看數據表的一種方法,可以查詢數據表中某些字段構成的數據,只是一些SQL 語句的集合。從安全的角度來說,視圖可以防止用戶接觸數據表,因而用戶不知道表結構。
- 表屬于全局模式中的表,是實表;視圖屬于局部模式的表,是虛表。
- 視圖的建立和刪除只影響視圖本身,不影響對應的基本表。
兩者的聯系:
- 視圖(view)是在基本表之上建立的表,它的結構(即所定義的列)和內容(即所有記錄) 都來自基本表,它依據基本表存在而存在。一個視圖可以對應一個基本表,也
- 可以對應多個基本 表。視圖是基本表的抽象和在邏輯意義上建立的新關系。
09. 使用觸發器時須特別注意
在使用觸發器的時候需要注意,對于相同的表,相同的事件只能創建一個觸發器,比如對 表account創建了一個BEFORE INSERT觸發器,那么如果對表account再次創建一個BEFORE INSERT觸發器,MySQL將會報錯,此時,只可以在表account上創建AFTER INSERT或者 BEFORE UPDATE類型的觸發器。靈活的運用觸發器將為操作省去很多麻煩。
10. 及時刪除不再需要的觸發器
觸發器定義之后,每次執行觸發事件,都會激活觸發器并執行觸發器中的語句。如果需求 發生變化,而觸發器沒有進行相應的改變或者刪除,則觸發器仍然會執行舊的語句,從而會影響 新的數據的完整性。因此,要將不再使用的觸發器及時刪除。
11. 提高sql查詢效率的30個查詢語句優化方法
01
對查詢進行優化,應盡量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。
02
應盡量避免在 where 子句中使用!=或<>操作符,否則將引擎放棄使用索引而進行全表掃描。
03
應盡量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如:
select id from t where num is null
可以在num上設置默認值0,確保表中num列沒有null值,然后這樣查詢:
select id from t where num=0
04
應盡量避免在 where 子句中使用 or 來連接條件,否則將導致引擎放棄使用索引而進行全表掃描,如:
select id from t where num=10 or num=20
可以這樣查詢:
select id from t where num=10union allselect id from t where num=20
05
下面的查詢也將導致全表掃描:
select id from t where name like '%abc%'
若要提高效率,可以考慮全文檢索。
06
in 和 not in 也要慎用,否則會導致全表掃描,如:
select id from t where substring(name,1,3)='abc'--name以abc開頭的idselect id from t where datediff(day,createdate,'2005-11-30')=0--'2005-11-30'生成的id
對于連續的數值,能用 between 就不要用 in 了:
select id from t where name like 'abc%'select id from t where createdate>='2005-11-30' and createdate<'2005-12-1'
07
如果在 where 子句中使用參數,也會導致全表掃描。因為SQL只有在運行時才會解析局部變量,但優化程序不能將訪問計劃的選擇推遲到運行時;它必須在編譯時進行選擇。然而,如果在編譯時建立訪問計劃,變量的值還是未知的,因而無法作為索引選擇的輸入項。如下面語句將進行全表掃描:
select id from t where num=@num
可以改為強制查詢使用索引:
select id from t with(index(索引名)) where num=@num
08
應盡量避免在 where 子句中對字段進行表達式操作,這將導致引擎放棄使用索引而進行全表掃描。如:
select col1,col2 into #t from t where 1=0
應改為:
create table #t(...)
09
應盡量避免在where子句中對字段進行函數操作,這將導致引擎放棄使用索引而進行全表掃描。如:
select id from t where substring(name,1,3)='abc'--name以abc開頭的idselect id from t where datediff(day,createdate,'2005-11-30')=0--'2005-11-30'生成的id
應改為:
select id from t where name like 'abc%'select id from t where createdate>='2005-11-30' and createdate<'2005-12-1'
10
不要在 where 子句中的“=”左邊進行函數、算術運算或其他表達式運算,否則系統將不能正確使用索引。
11
在使用索引字段作為條件時,如果該索引是復合索引,那么必須使用到該索引中的第一個字段作為條件時才能保證系統使用該索引,否則該索引將不會被使用,并且應盡可能的讓字段順序與索引順序相一致。
12
不要寫一些沒有意義的查詢,如需要生成一個空表結構:
select col1,col2 into #t from t where 1=0
這類代碼不會返回任何結果集,但是會消耗系統資源的,應改成這樣:
create table #t(...)
13
很多時候用 exists 代替 in 是一個好的選擇:
select num from a where num in(select num from b)
用下面的語句替換:
select num from a where exists(select 1 from b where num=a.num)
14
并不是所有索引對查詢都有效,SQL是根據表中數據來進行查詢優化的,當索引列有大量數據重復時,SQL查詢可能不會去利用索引,如一表中有字段sex,male、female幾乎各一半,那么即使在sex上建了索引也對查詢效率起不了作用。
15
索引并不是越多越好,索引固然可以提高相應的 select 的效率,但同時也降低了 insert 及 update 的效率,因為 insert 或 update 時有可能會重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。一個表的索引數最好不要超過6個,若太多則應考慮一些不常使用到的列上建的索引是否有必要。
16
應盡可能的避免更新 clustered 索引數據列,因為 clustered 索引數據列的順序就是表記錄的物理存儲順序,一旦該列值改變將導致整個表記錄的順序的調整,會耗費相當大的資源。若應用系統需要頻繁更新 clustered 索引數據列,那么需要考慮是否應將該索引建為 clustered 索引。
17
盡量使用數字型字段,若只含數值信息的字段盡量不要設計為字符型,這會降低查詢和連接的性能,并會增加存儲開銷。這是因為引擎在處理查詢和連接時會逐個比較字符串中每一個字符,而對于數字型而言只需要比較一次就夠了。
18
盡可能的使用 varchar/nvarchar 代替 char/nchar ,因為首先變長字段存儲空間小,可以節省存儲空間,其次對于查詢來說,在一個相對較小的字段內搜索效率顯然要高些。
19
任何地方都不要使用 select * from t ,用具體的字段列表代替“*”,不要返回用不到的任何字段。
20
盡量使用表變量來代替臨時表。如果表變量包含大量數據,請注意索引非常有限(只有主鍵索引)。
21
避免頻繁創建和刪除臨時表,以減少系統表資源的消耗。
22
臨時表并不是不可使用,適當地使用它們可以使某些例程更有效,例如,當需要重復引用大型表或常用表中的某個數據集時。但是,對于一次性事件,最好使用導出表。
23
在新建臨時表時,如果一次性插入數據量很大,那么可以使用 select into 代替 create table,避免造成大量 log ,以提高速度;如果數據量不大,為了緩和系統表的資源,應先create table,然后insert。
24
如果使用到了臨時表,在存儲過程的最后務必將所有的臨時表顯式刪除,先 truncate table ,然后 drop table ,這樣可以避免系統表的較長時間鎖定。
25
盡量避免使用游標,因為游標的效率較差,如果游標操作的數據超過1萬行,那么就應該考慮改寫。
26
使用基于游標的方法或臨時表方法之前,應先尋找基于集的解決方案來解決問題,基于集的方法通常更有效。
27
與臨時表一樣,游標并不是不可使用。對小型數據集使用 FAST_FORWARD 游標通常要優于其他逐行處理方法,尤其是在必須引用幾個表才能獲得所需的數據時。在結果集中包括“合計”的例程通常要比使用游標執行的速度快。如果開發時間允許,基于游標的方法和基于集的方法都可以嘗試一下,看哪一種方法的效果更好。
28
在所有的存儲過程和觸發器的開始處設置 SET NOCOUNT ON ,在結束時設置 SET NOCOUNT OFF 。無需在執行存儲過程和觸發器的每個語句后向客戶端發送 DONE_IN_PROC 消息。
29
盡量避免向客戶端返回大數據量,若數據量過大,應該考慮相應需求是否合理。
30
盡量避免大事務操作,提高系統并發能力。