初學者的數據庫索引簡介
> Congratulations
今天在ORM的時代,我們作為開發人員不必經常觸摸數據庫。我自己自己建立了我的第一個項目而不在項目內寫一行的原始SQL。
它起初工作正常。但是,在一段時間后,我們有一些真實的數據,API響應時間正在增加。
為了讓用戶體驗更好,我們試圖在這里和那里優化您的應用程序,但它沒有解決我們的實際問題。
很明顯,查詢數據庫是我們申請的瓶頸。因此,我們介紹了緩存,它本身就具有自己的成本。
今天,我將解釋什么是索引以及我們如何改進應用程序的性能。
開始吧…
什么是索引?
我們都知道數據庫是一系列大量數據。就像一本字典。
根據字典,我們可以真正容易地找到任何單詞,因為單詞以某種方式保存。它們被伴隨著詞典(按字排序)。
> Photo by Pisit Heng on Unsplash
數據庫索引是那樣的。當任何新數據插入到數據庫中時,創建一個單獨的表,以根據我們的需要組織數據,以便我們可以更快地找到它們。
因此,索引有助于在編寫數據時需要額外的時間,但它有助于讀取數據更快。如果您的應用程序編寫重,并且不需要讀取經常讀取數據,那么您可能不需要使用索引
足夠的談話!告訴我代碼
好的,讓我們首先創建一個具有一些基本信息的表。
第1步:創建表
我要顯示你的代碼主要是用postgres寫的,但其他SQL語言也非常相似。
- ID是該行的正常唯一標識符。
- NAME 名稱是一個字符串
- SALARY 是員工的薪水
- JOIN_DATE是一個日期類型。
Create TABLE EMPLOYEE (
ID INTEGER PRIMARY KEY ,
NAME VARCHAR (20),
SALARY INTEGER,
JOIN_DATE DATE
);
第2步:生成數據
好的,現在我們需要一些數據來玩一下。為此運行以下代碼。
我們不會詳細介紹此代碼。它所做的就是為我們產生一百萬個隨機的行。
如果您已有一份具有百萬數據的表,那么您可以使用它。
CREATE SEQUENCE employee_id_sequence
start 1
increment 1;
INSERT INTO EMPLOYEE
(ID ,NAME, SALARY, JOIN_DATE)
SELECT nextval('employee_id_sequence') ,
substr(md5(random()::text), 1, 10),
(random() * 70 + 10)::integer,
DATE '2018-01-01' + (random() * 700)::integer
FROM generate_series(1, 1000000);
第3步:讓我們找到一個名字
現在我們將嘗試在我們的數據庫中找到具有特定名稱的用戶。這是所有應用程序的常見用例。
您可以運行以下代碼來執行此操作。
EXPLAIN ANALYSE SELECT * FROM USERS
WHERE NAME ='cd54b20d57';
注意,解釋分析我們查詢的一部分是特定于Postgres。它實際上并沒有運行查詢。它只是分析查詢并給我們一些信息。
讓我們看看輸出和底部,我們可以看到我們的查詢執行時間為135ms
> the first query
第4步:創建索引
現在我們將在NAME字段上創建一個索引。語法適用于Postgres,但其他SQL將具有類似的格式。
CREATE INDEX ON EMPLOYEE(NAME);
它需要一些時間并創建索引。所以等待一段時間。
真理時刻
現在我們將再次運行以前的查詢。
現在看到輸出。
> After indexing
查詢的執行時間僅降至0.051 ms!
所以我們的查詢現在將更快地運行大約2600次。那是多么棒!
好,太棒了。恭喜這一點。希望你的新手(像我一樣)現在可以了解索引的力量。
這是今天。快樂編碼!:D.
(本文由聞數起舞翻譯自undefined的文章《How to Run Queries 2600 Times Faster》,轉載請注明出處,原文鏈接:
https://levelup.gitconnected.com/how-to-run-queries-2600-times-faster-a57506ed870f)