來源 | rrd.me/gmRQb
redis 在當前的技術社區里是非常熱門的。從來自 Antirez 一個小小的個人項目到成為內存數據存儲行業的標準,Redis已經走過了很長的一段路。隨之而來的一系列最佳實踐,使得大多數人可以正確地使用 Redis。
下面我們將探索正確使用 Redis 的10個經驗。
1、停止使用 KEYS *
Okay,以挑戰這個命令開始這篇文章,或許并不是一個好的方式,但其確實可能是最重要的一點。很多時候當我們關注一個redis實例的統計數據,我們會快速地輸入”KEYS *”命令,這樣key的信息會很明顯地展示出來。平心而論,從程序化的角度出發往往傾向于寫出下面這樣的偽代碼:
for key in'keys *':
doAllTheThings()
但是當你有1300萬個key時,執行速度將會變慢。因為KEYS命令的時間復雜度是O(n),其中n是要返回的keys的個數,這樣這個命令的復雜度就取決于數據庫的大小了。并且在這個操作執行期間,其它任何命令在你的實例中都無法執行。
作為一個替代命令,看一下 SCAN 吧,其允許你以一種更友好的方式來執行… SCAN 通過增量迭代的方式來掃描數據庫。這一操作基于游標的迭代器來完成的,因此只要你覺得合適,你可以隨時停止或繼續。
2、找出拖慢 Redis 的罪魁禍首
由于 Redis 沒有非常詳細的日志,要想知道在 Redis 實例內部都做了些什么是非常困難的。幸運的是 Redis 提供了一個下面這樣的命令統計工具:
127.0.0.1:6379> INFO commandstats
# Commandstats
cmdstat_get:calls=78,usec=608,usec_per_call=7.79
cmdstat_setex:calls=5,usec=71,usec_per_call=14.20
cmdstat_keys:calls=2,usec=42,usec_per_call=21.00
cmdstat_info:calls=10,usec=1931,usec_per_call=193.10
通過這個工具可以查看所有命令統計的快照,比如命令執行了多少次,執行命令所耗費的毫秒數(每個命令的總時間和平均時間) 只需要簡單地執行 CONFIG RESETSTAT 命令就可以重置,這樣你就可以得到一個全新的統計結果。
3、將 Redis-Benchmark 結果作為參考,而不要一概而論
Redis 之父 Salvatore 就說過:“通過執行GET/SET命令來測試Redis就像在雨天檢測法拉利的雨刷清潔鏡子的效果”。很多時候人們跑到我這里,他們想知道為什么自己的Redis-Benchmark統計的結果低于最優結果 。但我們必須要把各種不同的真實情況考慮進來,例如:
- 可能受到哪些客戶端運行環境的限制?
- 是同一個版本號嗎?
- 測試環境中的表現與應用將要運行的環境是否一致?
Redis-Benchmark的測試結果提供了一個保證你的 Redis-Server 不會運行在非正常狀態下的基準點,但是你永遠不要把它作為一個真實的“壓力測試”。壓力測試需要反應出應用的運行方式,并且需要一個盡可能的和生產相似的環境。
4、Hashes 是你的最佳選擇
以一種優雅的方式引入 hashes 吧。hashes 將會帶給你一種前所未有的體驗。之前我曾看到過許多類似于下面這樣的key結構:
foo:first_name
foo:last_name
foo:address
上面的例子中,foo 可能是一個用戶的用戶名,其中的每一項都是一個單獨的 key。這就增加了 犯錯的空間,和一些不必要的 key。使用 hash 代替吧,你會驚奇地發現竟然只需要一個 key :
127.0.0.1:6379> HSET foo first_name 'Joe'
(integer) 1
127.0.0.1:6379> HSET foo last_name 'Engel'
(integer) 1
127.0.0.1:6379> HSET foo address '1 Fanatical Pl'
(integer) 1
127.0.0.1:6379> HGETALL foo
1) 'first_name'
2) 'Joe'
3) 'last_name'
4) 'Engel'
5) 'address'
6) '1 Fanatical Pl'
127.0.0.1:6379> HGET foo first_name
'Joe'
5、設置 key 值的存活時間
無論什么時候,只要有可能就利用key超時的優勢。一個很好的例子就是儲存一些諸如臨時認證key之類的東西。當你去查找一個授權key時——以OAUTH為例——通常會得到一個超時時間。這樣在設置key的時候,設成同樣的超時時間,Redis就會自動為你清除!而不再需要使用KEYS *來遍歷所有的key了,怎么樣很方便吧?
6、 選擇合適的回收策略
既然談到了清除key這個話題,那我們就來聊聊回收策略。當 Redis 的實例空間被填滿了之后,將會嘗試回收一部分key。根據你的使用方式,我強烈建議使用 volatile-lru 策略——前提是你對key已經設置了超時。但如果你運行的是一些類似于 cache 的東西,并且沒有對 key 設置超時機制,可以考慮使用 allkeys-lru 回收機制。我的建議是先在這里查看一下可行的方案。
7、如果你的數據很重要,請使用 Try/Except
如果必須確保關鍵性的數據可以被放入到 Redis 的實例中,我強烈建議將其放入 try/except 塊中。幾乎所有的Redis客戶端采用的都是“發送即忘”策略,因此經常需要考慮一個 key 是否真正被放到 Redis 數據庫中了。至于將 try/expect 放到 Redis 命令中的復雜性并不是本文要講的,你只需要知道這樣做可以確保重要的數據放到該放的地方就可以了。
8、不要耗盡一個實例
無論什么時候,只要有可能就分散多redis實例的工作量。從3.0.0版本開始,Redis就支持集群了。Redis集群允許你基于key范圍分離出部分包含主/從模式的key。完整的集群背后的“魔法”可以在這里找到。但如果你是在找教程,那這里是一個再適合不過的地方了。如果不能選擇集群,考慮一下命名空間吧,然后將你的key分散到多個實例之中。關于怎樣分配數據,在redis.io網站上有這篇精彩的評論。
9、內核越多越好嗎?!
當然是錯的。Redis 是一個單線程進程,即使啟用了持久化最多也只會消耗兩個內核。除非你計劃在一臺主機上運行多個實例——希望只會是在開發測試的環境下!——否則的話對于一個 Redis 實例是不需要2個以上內核的。
10、高可用
到目前為止 Redis Sentinel 已經經過了很全面的測試,很多用戶已經將其應用到了生產環境中(包括 ObjectRocket )。如果你的應用重度依賴于 Redis ,那就需要想出一個高可用方案來保證其不會掉線。當然,如果不想自己管理這些東西,ObjectRocket 提供了一個高可用平臺,并提供7×24小時的技術支持,有意向的話可以考慮一下。