問題定義
在如何創建高效的數據庫索引中,我們說到過,可以通過有序的索引(B+tree)來避免排序操作,從而提升查詢的性能。但是如果排序子句或分組子句中的字段來自不同的表,那么數據庫優化器就無法利用索引的有序性來避免一次排序操作。
但是如果能從查詢中推斷出排序字段與另一個表的某個字段具有等值的關系,可以使用此字段來替換原排序字段,從而利用索引的有序性,在進行排序或分組時避免一次排序操作,從而提升SQL查詢性能。
譬如對于以下的SQL查詢:
select customer.* from customer, orders where c_custkey=o_custkey order by c_name, o_custkey;
- 1.
排序字段為 C_NAME, o_custkey,來自不同的兩個表,但是在查詢中條件c_custkey=o_custkey,所以可以用c_custkey來替換o_custkey, 重寫后的SQL如下:
select customer.* from customer, orders where c_custkey=o_custkey order by c_name, c_custkey;
- 1.
適用條件
分組排序優化是針對查詢塊(Queryblock)來進行的,多個查詢塊可以獨立進行此優化。分組排序優化的適用條件如下:
- 在一個查詢塊中存在等于或大于2的排序字段或分組字段。
- 排序字段或分組字段是數據表中的列(無函數或計算)。
- 排序字段或分組字段來自不同的數據表。
- 在此查詢塊中可以推導出與排序或分組字段的等值關系。
- 經過推導替換后的排序或分組字段來自同一個數據表。
性能驗證
- 重寫優化前的執行計劃如下,可以看到執行時間為10ms,代價7849.64,執行計劃的最后一步是排序操作。
- 重寫優化后,排序子句中的o_custkey被替換為c_custkey,執行計劃如下。可以看到,優化后排序操作被消除了,其他部分沒有變化。執行時間減少到2.58ms,性能提升了287.6%。
PawSQL對此優化的支持
PawSQL針對所有數據庫默認開啟此優化,
- 自動優化:用戶輸入待優化SQL后,PawSQL對其進行自動化優化,案例SQL的優化詳情如下。
- 規則啟用:用戶可以在自己的默認優化設置或是定義每個優化任務的時候自主啟用或禁用該選項。
關于PawSQL
PawSQL專注數據庫性能優化的自動化和智能化,支持MySQL,PostgreSQL,Opengauss,Oracle等數據庫,提供的SQL優化產品包括
- PawSQL Cloud,在線自動化SQL優化工具,支持SQL審查,智能查詢重寫、基于代價的索引推薦,適用于數據庫管理員及數據應用開發人員。
- PawSQL Advisor,IntelliJ 插件, 適用于數據應用開發人員,可以IDEA/DataGrip應用市場通過名稱搜索“PawSQL Advisor”安裝。
- PawSQL Engine, 是PawSQL系列產品的后端優化引擎,可以以Docker鏡像的方式獨立安裝部署,并通過http/json的接口提供SQL優化服務。