亚洲欧美一区二区性爱片,中文字幕人妻美腿丝袜乱一区三区 ,国产精品在线观看

一、背景介紹

從系統設計角度看，一個系統從設計搭建到數據逐步增長，SQL 執行效率可能會出現劣化，為繼續支撐業務發展，我們需要對慢 SQL 進行分析和優化，嚴峻的情況下甚至需要對整個系統進行重構。所以我們往往需要在系統設計前對業務進行充分調研、遵守系統設計規范，在系統運行時定期結合當前業務發展情況進行系統瓶頸的分析。

從數據庫角度看，每個 SQL 執行都需要消耗一定 I/O 資源，SQL 執行的快慢，決定了資源被占用時間的長短。假如有一條慢 SQL 占用了 30%的資源共計 1 分鐘。那么在這 1 分鐘時間內，其他 SQL 能夠分配的資源總量就是 70%，如此循環，當資源分配完的時候，所有新的 SQL 執行將會排隊等待。所以往往一條慢 SQL 會影響到整個業務。

本文僅討論 MySQL-InnoDB 的情況。

二、優化方式

SQL 語句執行效率的主要因素：

1）數據量

SQL 執行后返回給客戶端的數據量的大小；
數據量越大需要掃描的 I/O 次數越多，數據庫服務器的 IO 更容易成為瓶頸。

2）取數據的方式

數據在緩存中還是在磁盤上；
是否能夠通過全局索引快速尋址；
是否結合謂詞條件命中全局索引加速掃描。

3）數據加工的方式

排序、子查詢、聚合、關聯等，一般需要先把數據取到臨時表中，再對數據進行加工；
對于數據量比較多的計算，會消耗大量計算節點的 CPU 資源，讓數據加工變得更加緩慢；
是否選擇了合適的 join 方式。

1、優化思路

1）減少數據掃描（減少磁盤訪問）

盡量在查詢中加入一些可以提前過濾數據的謂詞條件，比如按照時間過濾數據等，可以減少數據的掃描量，對查詢更友好；
在掃描大表數據時是否可以命中索引，減少回表代價，避免全表掃描。

2）返回更少數據（減少網絡傳輸或磁盤訪問）

3）減少交互次數（減少網絡傳輸）

將數據存放在更快的地方；
某條查詢涉及到大表，無法進一步優化，如果返回的數據量不大且變化頻率不高但訪問頻率很高，此時應該考慮將返回的數據放在應用端的緩存當中或者 redis 這樣的緩存當中，以提高存取速度。

4）減少服務器 CPU 開銷（減少 CPU 及內存開銷）

5）避免大事務操作

6）利用更多資源（增加資源）

2、優化案例

1）數據分頁優化

select * from table_demo where type = ? limit ?,?;

優化方式一：偏移 id

lastId = 0 or min(id)

do {

select * from table_demo where type = ? and id >{#lastId} limit ?;

lastId = max(id)

} while (isNotEmpty)

優化方式二：分段查詢

該方式較方式一的優點在于可并行查詢，每個分段查詢互不依賴；較方式一的缺點在于較依賴數據的連續性，若數據過于分散，代價較高。

minId = min(id) maxId = max(id)

for(int i = minId; i<= maxId; i+=pageSize){

select * from table_demo where type = ? and id between i and i+ pageSize;

}

2）優化 GROUP BY

提高 GROUP BY 語句的效率, 可以通過將不需要的記錄在 GROUP BY 之前過濾掉.下面兩個查詢返回相同結果但第二個明顯就快了許多。

低效：

select job , avg(sal) from table_demo group by job having job = ‘manager'

高效：

select job , avg(sal) from table_demo where job = ‘manager' group by job

3）范圍查詢

聯合索引中如果有某個列存在范圍（大于小于）查詢，其右邊的列是否還有意義？

explain select count(1) from statement where org_code='1012' and trade_date_time >= '2019-05-01 00:00:00' and trade_date_time<='2020-05-01 00:00:00'

explain select * from statement where org_code='1012' and trade_date_time >= '2019-05-01 00:00:00' and trade_date_time<='2020-05-01 00:00:00' limit 0, 100

explain select * from statement where org_code='1012' and trade_date_time >= '2019-05-01 00:00:00' and trade_date_time<='2020-05-01 00:00:00'

使用單鍵索引 trade_date_time 的情況下

a. 從索引里找到所有 trade_date_time 在'2019-05-01' 到'2020-05-01' 區間的主鍵 id，假設有 100 萬個；

b. 對這些 id 進行排序（為的是在下面一步回表操作中優化 I/O 操作，因為很多挨得近的主鍵可能一次磁盤 I/O 就都取到了）；

c. 回表，查出 100 萬行記錄，然后逐個掃描，篩選出 org_code='1020'的行記錄。

使用聯合索引 trade_date_time, org_code -聯合索引 trade_date_time, org_code 底層結構推導如下：

以查找 trade_date_time >='2019-05-01' and trade_date_time <='2020-05-01' and org_code='1020'為例：

a. 在范圍查找的時候,直接找到最大,最小的值,然后進行鏈表遍歷，故僅能用到 trade_date_time 的索引，無法使用到 org_code 索引；

b. 基于 MySQL5.6+的索引下推特性，雖然 org_code 字段無法使用到索引樹，但是可以用于過濾回表的主鍵 id 數。

小結：對于該 case, 索引效果[org_code,trade_date_time] > [trade_date_time, org_code]>[trade_date_time]。實際業務場景中，檢索條件中 trade_date_time 基本上肯定會出現，但 org_code 卻不一定，故索引的設計還需要結合實際業務需求。

4）優化 Order by

索引：

KEY `idx_account_trade_date_time` (`account_number`,`trade_date_time`),

KEY `idx_trade_date_times` (`trade_date_time`)

KEY `idx_createtime` (`create_time`),

慢 SQL：

SELECT id,....,creator,modifier,create_time,update_time FROM statement

WHERE (account_number = 'XXX' AND create_time >= '2022-04-24 06:03:44' AND create_time <= '2022-04-24 08:03:44' AND dc_flag = 'C') ORDER BY trade_date_time DESC,id DESC LIMIT 0,1000;

優化前：SQL 執行超時被 kill 了

SELECT id,....,creator,modifier,create_time,update_time FROM statement

WHERE (account_number = 'XXX' AND create_time >= '2022-04-24 06:03:44' AND create_time <= '2022-04-24 08:03:44' AND dc_flag = 'C') ORDER BY create_time DESC,id DESC LIMIT 0,1000;

優化后：執行總行數為:6 行，耗時 34ms。

MySQL使不使用索引與所查列無關，只與索引本身，where條件，order by 字段，group by 字段有關。索引的作用一個是查找，一個是排序。

5）業務拆分

select * from order where status='S' and update_time < now-5min limit 500

拆分優化：

隨著業務數據的增長 status='S'的數據基本占據數據的 90%以上，此時該條件無法走索引。我們可以結合業務特征，對數據獲取按日期進行拆分。

date = now; minDate = now - 10 days

while(date > minDate) {

select * from order where order_date={#date} and status='S' and update_time < now-5min limit 500

date = data + 1

}

3、數據庫結構優化

1）范式優化：表的設計合理化（符合 3NF），比如消除冗余（節省空間）；

2）反范式優化：比如適當加冗余等（減少 join）

3）拆分表：分區將數據在物理上分隔開，不同分區的數據可以制定保存在處于不同磁盤上的數據文件里。這樣，當對這個表進行查詢時，只需要在表分區中進行掃描，而不必進行全表掃描，明顯縮短了查詢時間，另外處于不同磁盤的分區也將對這個表的數據傳輸分散在不同的磁盤 I/O，一個精心設置的分區可以將數據傳輸對磁盤 I/O 競爭均勻地分散開。對數據量大的表可采取此方法，可按月建表分區。

4、SQL 語句優化

SQL 檢查狀態及分數計算邏輯