日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

  今天遇到一個left join優化的問題,搞了一下午,中間查了不少資料,對MySQL的查詢計劃還有查詢優化有了更進一步的了解,做一個簡單的記錄: 

select c.* from hotel_info_original c 
left join hotel_info_collection h 
on c.hotel_type=h.hotel_type and c.hotel_id =h.hotel_id 
where h.hotel_id is null 

   這個sql是用來查詢出c表中有h表中無的記錄,所以想到了用left join的特性(返回左邊全部記錄,右表不滿足匹配條件的記錄對應行返回null)來滿足需求,不料這個查詢非常慢。先來看查詢計劃: 



   rows代表這個步驟相對上一步結果的每一行需要掃描的行數,可以看到這個sql需要掃描的行數為35773*8134,非常大的一個數字。本來c和h表的記錄條數分別為40000+和10000+,這幾乎是兩個表做笛卡爾積的開銷了(select * from c,h)。 
于是我上網查了下MySQL實現join的原理,原來MySQL內部采用了一種叫做 nested loop join的算法。Nested Loop Join 實際上就是通過驅動表的結果集作為循環基礎數據,然后一條一條的通過該結果集中的數據作為過濾條件到下一個表中查詢數據,然后合并結果。如果還有第三個參與 Join,則再通過前兩個表的 Join 結果集作為循環基礎數據,再一次通過循環查詢條件到第三個表中查詢數據,如此往復,基本上MySQL采用的是最容易理解的算法來實現join。所以驅動表的選擇非常重要,驅動表的數據小可以顯著降低掃描的行數。 
那么為什么一般情況下join的效率要高于left join很多?很多人說不明白原因,只人云亦云,我今天下午感悟出來了一點。一般情況下參與聯合查詢的兩張表都會一大一小,如果是join,在沒有其他過濾條件的情況下MySQL會選擇小表作為驅動表,但是left join一般用作大表去join小表,而left join本身的特性決定了MySQL會用大表去做驅動表,這樣下來效率就差了不少,如果我把上面那個sql改成 
select c.* from hotel_info_original c 
join hotel_info_collection h 
on c.hotel_type=h.hotel_type and c.hotel_id =h.hotel_id 
查詢計劃如下: 



     很明顯,MySQL選擇了小表作為驅動表,再配合(hotel_id,hotel_type)上的索引瞬間降低了好多個數量級。。。。。 
另外,我今天還明白了一個關于left join 的通用法則,即:如果where條件中含有右表的非空條件(除開is null),則left join語句等同于join語句,可直接改寫成join語句。 
后記: 
隨著查看MySQL reference manual對這個問題進行了更進一步的了解。MySQL在執行join時會把join分為system/const/eq_ref/ref/range/index/ALl等好幾類,連接的效率從前往后 
依次遞減,對于我的第一個sql,連接類型是index,所以幾乎是全表掃描的效果。但是我很奇怪我在(hotel_id,hotel_type)兩列上聲明了unique key,根據官方文檔連接類型應該是eq_ref才對, 
     這個問題一直困擾了我兩天,在google和stackoverflow上都沒有找到能夠解釋這個問題的文章,莫非我這個問題無解了?抱著解決這個問題的決心今天又翻看了一遍MySQL官方文檔 
關于優化查詢的部分,看到了這樣一句:這里的一個問題是MySQL能更高效地在聲明具有相同類型和尺寸的列上使用索引。我感覺我找到了問題所在,于是我將original和 collection表的(hotel_type,hotel_id)的encoding和collation(決定字符比較的規則)全部改成統一的utf8_general_ci,然后再次運行第一條sql的查詢計劃,得到如下結果: 



     連接類型已經由index優化到了ref,如果將hotel_type申明為not null可以優化到eq_ref,不過這里影響不大了,優化后這條sql能在0.01ms內運行完。 

     那么如何優化left join: 
1、條件中盡量能夠過濾一些行將驅動表變得小一點,用小表去驅動大表 

2、右表的條件列一定要加上索引(主鍵、唯一索引、前綴索引等),最好能夠使type達到range及以上(ref,eq_ref,const,system) 

3、無視以上兩點,一般不要用left join~~!

分享到:
標簽:left join
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定