日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

點擊這里在線咨詢客服

網站：51998
待審：31
小程序：12
文章：1030137
會員：747

首頁 > 新聞資訊 > IT業界 >正文

一種高性能的每組最大值SQL查詢方法

發布時間：2024-03-09 01:08:47 作者：網友整理

本文介紹了一種高性能的每組最大值SQL查詢方法的處理方法，對大家解決問題具有一定的參考價值，需要的朋友們下面隨著小編來一起學習吧！

問題描述

我正在嘗試構建一個基礎結構，用于按需快速運行回歸，從包含我們的Web服務器上所有歷史活動的數據庫中提取Apache請求。為了通過確保我們仍然遞減來自較小客戶端的請求來提高覆蓋率，我希望通過為每個客戶端檢索至多n個(對于這個問題，假設10個)請求來確保請求的分布。

我在這里找到了許多類似問題的答案，其中最接近的似乎是SQL query to return top N rows per ID across a range of IDs，但答案大多是與性能無關的解決方案
我已經試過了。例如，ROW_NUMBER()分析函數為我們提供了所需的數據：

SELECT
    *
FROM
    (
    SELECT
        dailylogdata.*,
        row_number() over (partition by dailylogdata.contextid order by occurrencedate) rn
    FROM
        dailylogdata
    WHERE
        shorturl in (?)
    )
WHERE
    rn <= 10;

但是，假設該表包含給定一天的數百萬個條目，并且這種方法需要從索引中讀取與我們的選擇標準匹配的所有行，以便應用ROW_NUMBER分析函數，則性能非常糟糕。我們最終選擇了近一百萬行，卻因為它們的row_number超過10而丟棄了其中的絕大多數。

|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|| Id  | Operation                            | Name                    | Starts | E-Rows | A-Rows |   A-Time   | Buffers | Reads  | Writes |  OMem |  1Mem | Used-Mem | Used-Tmp||
|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
||   0 | SELECT STATEMENT                     |                         |      1 |        |  12222 |00:09:08.94 |     895K|    584K|    301 |       |       |          |         ||
||*  1 |  VIEW                                |                         |      1 |   4427K|  12222 |00:09:08.94 |     895K|    584K|    301 |       |       |          |         ||
||*  2 |   WINDOW SORT PUSHED RANK            |                         |      1 |   4427K|  13536 |00:09:08.94 |     895K|    584K|    301 |  2709K|   743K|   97M (1)|    4096 ||
||   3 |    PARTITION RANGE SINGLE            |                         |      1 |   4427K|    932K|00:22:27.90 |     895K|    584K|      0 |       |       |          |         ||
||   4 |     TABLE ACCESS BY LOCAL INDEX ROWID| DAILYLOGDATA            |      1 |   4427K|    932K|00:22:27.61 |     895K|    584K|      0 |       |       |          |         ||
||*  5 |      INDEX RANGE SCAN                | DAILYLOGDATA_URLCONTEXT |      1 |  17345 |    932K|00:00:00.75 |    1448 |      0 |      0 |       |       |          |         ||
|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|                                                                                                                                                                                 |
|Predicate Information (identified by operation id):                                                                                                                              |
|---------------------------------------------------                                                                                                                              |
|                                                                                                                                                                                 |
|   1 - filter("RN"<=:SYS_B_2)                                                                                                                                                    |
|   2 - filter(ROW_NUMBER() OVER ( PARTITION BY "DAILYLOGDATA"."CONTEXTID" ORDER BY "OCCURRENCEDATE")<=:SYS_B_2)                                                                  |
|   5 - access("SHORTURL"=:P1)                                                                                                                                                    |
|                                                                                                                                                                                 |
+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

但是，如果我們只查詢特定上下文ID的前10個結果，則可以大大加快執行速度：

SELECT
    *
FROM
    (
    SELECT
        dailylogdata.*
    FROM
        dailylogdata
    WHERE
        shorturl in (?)
        and contextid = ?
    )
WHERE
    rownum <= 10;

運行此查詢的統計信息：

|-------------------------------------------------------------------------------------------------------------------------|
|| Id  | Operation                           | Name                    | Starts | E-Rows | A-Rows |   A-Time   | Buffers ||
|-------------------------------------------------------------------------------------------------------------------------|
||   0 | SELECT STATEMENT                    |                         |      1 |        |     10 |00:00:00.01 |      14 ||
||*  1 |  COUNT STOPKEY                      |                         |      1 |        |     10 |00:00:00.01 |      14 ||
||   2 |   PARTITION RANGE SINGLE            |                         |      1 |     10 |     10 |00:00:00.01 |      14 ||
||   3 |    TABLE ACCESS BY LOCAL INDEX ROWID| DAILYLOGDATA            |      1 |     10 |     10 |00:00:00.01 |      14 ||
||*  4 |     INDEX RANGE SCAN                | DAILYLOGDATA_URLCONTEXT |      1 |      1 |     10 |00:00:00.01 |       5 ||
|-------------------------------------------------------------------------------------------------------------------------|
|                                                                                                                         |
|Predicate Information (identified by operation id):                                                                      |
|---------------------------------------------------                                                                      |
|                                                                                                                         |
|   1 - filter(ROWNUM<=10)                                                                                                |
|   4 - access("SHORTURL"=:P1 AND "CONTEXTID"=TO_NUMBER(:P2))                                                             |
|                                                                                                                         |
+-------------------------------------------------------------------------------------------------------------------------+

在本例中，Oracle足夠聰明，可以在獲得10個結果后停止檢索數據。我可以收集一組完整的上下文ID并以編程方式生成一個查詢，該查詢由每個上下文ID的一個查詢實例和union all整個查詢組成，但是考慮到上下文ID的絕對數量，我們可能會遇到Oracle內部的限制，即使不是這樣，這種方法也充滿了笨拙的味道。

有沒有人知道有一種方法可以保持第一個查詢的簡單性，同時保持與第二個查詢相稱的性能？還要注意，我實際上并不關心檢索一組穩定的行；只要它們滿足我的標準，它們就可以用于回歸。

編輯：Adam Musch的建議奏效了。我在這里附加了他的更改的性能結果，因為我無法將它們放在對他的答案的評論回應中。這次我還使用了一個更大的數據集進行測試，以下是來自我最初的ROW_NUMBER方法的(緩存)統計數據以供比較：

|-------------------------------------------------------------------------------------------------------------------------------------------------|
|| Id  | Operation                     | Name              | Starts | E-Rows | A-Rows |   A-Time   | Buffers | Reads  |  OMem |  1Mem | Used-Mem ||
|-------------------------------------------------------------------------------------------------------------------------------------------------|
||   0 | SELECT STATEMENT              |                   |      1 |        |  12624 |00:00:22.34 |    1186K|    931K|       |       |          ||
||*  1 |  VIEW                         |                   |      1 |   1163K|  12624 |00:00:22.34 |    1186K|    931K|       |       |          ||
||*  2 |   WINDOW NOSORT               |                   |      1 |   1163K|   1213K|00:00:21.82 |    1186K|    931K|  3036M|    17M|          ||
||   3 |    TABLE ACCESS BY INDEX ROWID| TWTEST            |      1 |   1163K|   1213K|00:00:20.41 |    1186K|    931K|       |       |          ||
||*  4 |     INDEX RANGE SCAN          | TWTEST_URLCONTEXT |      1 |   1163K|   1213K|00:00:00.81 |    8568 |      0 |       |       |          ||
|-------------------------------------------------------------------------------------------------------------------------------------------------|
|                                                                                                                                                 |
|Predicate Information (identified by operation id):                                                                                              |
|---------------------------------------------------                                                                                              |
|                                                                                                                                                 |
|   1 - filter("RN"<=10)                                                                                                                          |
|   2 - filter(ROW_NUMBER() OVER ( PARTITION BY "CONTEXTID" ORDER BY  NULL )<=10)                                                                 |
|   4 - access("SHORTURL"=:P1)                                                                                                                    |
+-------------------------------------------------------------------------------------------------------------------------------------------------+

我冒昧地略微簡化了Adam的建議；以下是修改后的查詢…

select
    *
from
    twtest
where
    rowid in (
    select
            rowid
    from (
            select
                    rowid,
                    shorturl,
                    row_number() over (partition by shorturl, contextid
                                                      order by null) rn
            from
                    twtest
    )
    where rn <= 10
    and shorturl in (?)
);

…及其(緩存)評估的統計信息：

|--------------------------------------------------------------------------------------------------------------------------------------|
|| Id  | Operation                   | Name              | Starts | E-Rows | A-Rows |   A-Time   | Buffers |  OMem |  1Mem | Used-Mem ||
|--------------------------------------------------------------------------------------------------------------------------------------|
||   0 | SELECT STATEMENT            |                   |      1 |        |  12624 |00:00:01.33 |   19391 |       |       |          ||
||   1 |  NESTED LOOPS               |                   |      1 |      1 |  12624 |00:00:01.33 |   19391 |       |       |          ||
||   2 |   VIEW                      | VW_NSO_1          |      1 |   1163K|  12624 |00:00:01.27 |    6770 |       |       |          ||
||   3 |    HASH UNIQUE              |                   |      1 |      1 |  12624 |00:00:01.27 |    6770 |  1377K|  1377K| 5065K (0)||
||*  4 |     VIEW                    |                   |      1 |   1163K|  12624 |00:00:01.25 |    6770 |       |       |          ||
||*  5 |      WINDOW NOSORT          |                   |      1 |   1163K|   1213K|00:00:01.09 |    6770 |   283M|  5598K|          ||
||*  6 |       INDEX RANGE SCAN      | TWTEST_URLCONTEXT |      1 |   1163K|   1213K|00:00:00.40 |    6770 |       |       |          ||
||   7 |   TABLE ACCESS BY USER ROWID| TWTEST            |  12624 |      1 |  12624 |00:00:00.04 |   12621 |       |       |          ||
|--------------------------------------------------------------------------------------------------------------------------------------|
|                                                                                                                                      |
|Predicate Information (identified by operation id):                                                                                   |
|---------------------------------------------------                                                                                   |
|                                                                                                                                      |
|   4 - filter("RN"<=10)                                                                                                               |
|   5 - filter(ROW_NUMBER() OVER ( PARTITION BY "SHORTURL","CONTEXTID" ORDER BY NULL NULL )<=10)                                       |
|   6 - access("SHORTURL"=:P1)                                                                                                         |
|                                                                                                                                      |
|Note                                                                                                                                  |
|-----                                                                                                                                 |
|   - dynamic sampling used for this statement (level=2)                                                                               |
|                                                                                                                                      |
+--------------------------------------------------------------------------------------------------------------------------------------+

正如所宣傳的，我們只訪問經過完全篩選的行的dailylogdata表。我擔心似乎仍在根據它聲稱正在選擇的行數(1213K)對urlContext索引進行完全掃描，但考慮到它只使用6770個緩沖區(即使我增加了上下文特定結果的數量，這個數字也保持不變)，這可能具有誤導性。

推薦答案

這是一個不太好的解決方案，但似乎做了您想做的事情：盡快縮短索引掃描，并在通過篩選條件和top-n查詢條件限定數據之前不讀取數據。

請注意，測試時使用的是shorturl =條件，而不是shorturl IN條件。

with rowid_list as (select rowid from (select * from (select rowid, row_number() over (partition by shorturl, contextid order by null) rn from dailylogdata ) where rn <= 10 ) where shorturl = ? ) select * from dailylogdata where rowid in (select rowid from rowid_list)

with子句獲取前10個ROID，為滿足您的條件的shorturl和contextid的每個唯一組合篩選一個窗口NOSORT。然后，它循環遍歷這組roid，按rowid獲取每個roid。

---------------------------------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | ---------------------------------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 1 | 286 | 1536 (1)| 00:00:19 | | 1 | NESTED LOOPS | | 1 | 286 | 1536 (1)| 00:00:19 | | 2 | VIEW | VW_NSO_1 | 136K| 1596K| 910 (1)| 00:00:11 | | 3 | HASH UNIQUE | | 1 | 3326K| | | |* 4 | VIEW | | 136K| 3326K| 910 (1)| 00:00:11 | |* 5 | WINDOW NOSORT | | 136K| 2794K| 910 (1)| 00:00:11 | |* 6 | INDEX RANGE SCAN | TABLE_REDACTED_INDEX | 136K| 2794K| 910 (1)| 00:00:11 | | 7 | TABLE ACCESS BY USER ROWID| TABLE_REDACTED | 1 | 274 | 1 (0)| 00:00:01 | ---------------------------------------------------------------------------------------------------- Predicate Information (identified by operation id): --------------------------------------------------- 4 - filter("RN"<=10) 5 - filter(ROW_NUMBER() OVER ( PARTITION BY "CLIENT_ID","SCE_ID" ORDER BY NULL NULL )<=10) 6 - access("TABLE_REDACTED"."SHORTURL"=:b1)

這篇關于一種高性能的每組最大值SQL查詢方法的文章就介紹到這了，希望我們推薦的答案對大家有所幫助，

分享到：
標簽：errorHighperformanceapproachtogreatest-n-per-groupSQLquery exception grea

網友整理

注冊時間：

網站：5 個小程序：0 個文章：12 篇

51998
網站

12
小程序

1030137
文章

747
會員
趕快注冊賬號，推廣您的網站吧！

文章分類

今日頭條
財經視界
科技前沿
娛樂頻道
搜索優化
游戲電競
網站運營
互聯網
IT業界
自媒體
手機數碼
人工智能
區塊鏈
5G網絡
小程序
電商
短視頻

熱門網站

各百科-專業百科問答知識名網站 m.geelcn.com

免費軟件,綠色軟件園,手機軟件下載,熱門游戲下載中心-中當網 m.deelcn.com

魔扣科技 www.ylptlb.cn

體育新聞_國際體育資訊_全球體育賽事-中名網 www.feelcn.com/tiyu/tiyuxinwen/

食品安全_健康飲食_舌尖上的安全-中名網 www.feelcn.com/shenghuo/shipinanquan/

中合網 www.heelcn.com

中當網 www.deelcn.com

魔扣網站維護代運營 www.ylptlb.cn/tg

中合網-健康養生知識科普名站 m.heelcn.com

各百科 www.geelcn.com

最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲，玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題，題庫，初中，高中，大學四六

運動步數有氧達人2018-06-03

記錄運動步數，積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定

熱門文章

民以食為天離線人臉識別助力打造智慧食堂 08-20

青桔單車發布3款新車已進入150個城市 08-13

民間大神用Win7毛玻璃UI風格改造Win10：情懷滿滿 08-06

網站標題是否可以修改？怎么改不影響網站權重？ 11-19

關于網站標題和正文的匹配度分析 09-29

從滾石、華納到環球，三個關鍵詞讀懂網易云為何成版權方最愛 08-12

天眼被注冊為煙草商標，中國控煙協會要求嚴查 08-13

深圳實現5G獨立組網全覆蓋已累計建設5G基站超4.6萬個 08-17

滴滴App內嵌買車服務已在十余城上線 08-06

關鍵詞的密度要結合頁面版式來調整 11-28

關于我們| 收錄標準| 廣告合作| 免責聲明| 友情鏈接

網站地圖 ? 2023 版權所有：魔扣目錄 www.ylptlb.cn

感谢您访问我们的网站，您可能还对以下资源感兴趣：
日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡