導言
redis是一個高效的內存數據庫,它支持包括String、List、Set、SortedSet和Hash等數據類型的存儲,在Redis中通常根據數據的key查詢其value值,Redis沒有模糊條件查詢,在面對一些需要分頁、排序以及條件查詢的場景時(如評論,時間線,檢索等),只憑借Redis所提供的功能就不太好不處理了。
本文不對Redis的特性做過多贅述。由于之前基于業務問題需要實現基于Redis的條件查詢和分頁功能,在百度上查詢了不少文章,基本不是只有分頁功能就是只有條件查詢功能的實現,缺少兩者組合的解決方案。因此,本文將基于Redis提供條件查詢+分頁的技術解決方案。
注:本文只提供實現思路,并不提供實現的代碼
本文將從四個部分進行說明:
- 分頁實現
- 模糊條件查詢實現
- 分頁和模糊條件查詢的組合實現
- 優化方案
大家可以直接跳到自己需要的部分進行閱讀。
Redis的分頁實現
我們通常習慣于在MySQL、Oracle這樣持久化數據庫中實現分頁查詢,但是基于某些特殊的業務場景下,我們的數據并未持久化到了數據庫中或是出于查詢速度上的考慮將熱點數據加載到了緩存數據庫中。因此,我們可能需要基于Redis這樣的緩存數據庫去進行分頁查詢。
Redis的分頁查詢的實現是基于Redis提供的ZSet數據結構實現的,ZSet全稱為Sorted Set,該結構主要存儲有序集合。下面是它的指令描述以及該指令在分頁實現中的作用:
- ZADD:SortedSet的添加元素指令ZADD key score member [[score,member]…]會給每個添加的元素member綁定一個用于排序的值score,SortedSet就會根據score值的大小對元素進行排序。我們為通常習慣于將數據的時間屬性當作score用于排序,當然大家也可以根據具體的業務場景去選擇排序的目標。
- ZREVRANGE:SortedSet中的指令ZREVRANGE key start stop可以返回指定區間內的成員,可以用來做分頁。
- ZREM:SortedSet的指令ZREM key member可以根據key移除指定的成員,能滿足刪評論的要求。
所以SortedSet用來做分頁是非常適合的。下面是分頁實現的演示圖,包含插入新記錄后的查詢情況。
事實上,Redis中的List結構也是可以實現分頁,但List無法實現自動排序,并且Zset還可以根據score進行數據篩選,取出目標score區間內數據。
所以在實現上,ZSet往往更加適合我們。當然如果你需要插入重復數據的情況下,分頁就可能就需要借助List來實現了。具體使用那種結構來實現分頁還是需要根據實際的業務場景來進行選擇的。
Redis的多條件模糊查詢實現
Redis是key-value類型的內存數據庫,通過key直接取數據雖然很方便,但是并未提供像mysql那樣方便的sql條件查詢支持。因此我們需要借助Redis提供的結構和功能去自己實現模糊條件查詢功能。
事實上,Redis的模糊條件查詢是基于Hash實現的,我們可以將數據的某些條件值作為hash的key值,并數據本身作為value進行存儲。然后通過Hash提供的HSCAN指令去遍歷所有的key進行篩選,得到我們符合條件的所有key值(hscan可以進行模式匹配)。
為了方便,我們通常將符合條件的key全部放入到一個Set或是List中。這樣一來,我們就可以根據得到的key值去取出相應的數據了。下面是模糊查詢的演示圖(其中field中的命名規則為<id>:<姓名>:<性別>,value為用戶詳情的json串)。
查詢所有性別為女的用戶
查詢所有名字中姓阿的用戶
HSCAN雖然為我們提供了模式匹配的功能,但這種匹配是基于遍歷實現的,每一次匹配都需要遍歷全部的key,效率上并不高。因此在下面一節會這方面進行補充,本節只談如何實現模糊匹配。
Redis的分頁+多條件模糊查詢組合實現
前面分別單獨敘述了如何實現Redis的分頁和多條件某查詢。在實際使用中,單獨使用ZSet實現分頁已經能夠展現不錯的性能了,但存在一個問題是我們所分頁的數據往往是伴隨著一些動態的篩選條件的,而ZSet并不提供這樣的功能。
面對這種情況,我們通常有兩種解決方案:
- 如果數據已經存儲在了持久化數據庫中,我們可以每次在數據庫中做好條件查詢再將數據放入Redis中進行分頁。
- 在Redis中實現多條件模糊查詢并分頁。
前者方案其實是一個不錯的選擇,但缺點在于數據有時候并不一定都在持久化數據庫中。在有些業務場景下,我們的數據為了展現更好的并發性以及高響應,我們的數據會先放置在緩存數據庫中,等到某個時間或者滿足某種條件時再持久化到數據庫中。
在這種情況下我們第一個方案就不起作用了,需要使用第二個方案。因此,下面將介紹如何實現多條件模糊查詢的基礎上進行分頁。
實現思路
首先我們可以采用多條件模糊查詢章節所說的方式,將我們所涉及到的條件字段作為hash的field,而數據的內容則作為對應value進行存儲(一般以json格式存儲,方便反序列化)。
我們需要實現約定好查詢的格式,用前面一節的例子來說,field中的命名規則為<id>:<姓名>:<性別>,我們每次可以通過"*"來實現我們希望的模糊匹配條件,比如“*:*:男”就是匹配所有男性數據,“100*:*:*”就是匹配所有id前綴為100的用戶。
當我們拿到了匹配串后我們先去Redis中尋找是否存在以該匹配串為key的ZSet,如果沒有則通過Redis提供的HSCAN遍歷所有hash的field,得到所有符合條件的field,并將其放入一個ZSet集合,同時將這個集合的key設置為我們的條件匹配串。如果已經存在了,則直接對這個ZSet進行分頁查詢即可。對ZSet進行分頁的方式已經在前面敘述過了。通過這樣的方式我們就實現了最簡單的分頁+多條件模糊查詢。另外,搜索公眾號Github猿后臺回復“賺錢”,獲取一份驚喜禮包。
上圖中,由于并未在緩存數據庫中找到符合的ZSet集合,我們將根據匹配串生成一個新的集合用于分頁。
性能優化方案
雖然上文實現了多條件模糊查詢+分頁的功能,但是在時間開發中,我們不能無限制的生成新的集合,因為匹配串是很多樣化的,這會給緩存帶來巨大的壓力。
因此我們在生成集合時可以賦予這個集合一個過期時間,到期集合會自動銷毀。因為根據時間局部性原理,我們在一段時間內不訪問的數據大概率在很長一頓時間內也不會再訪問。而對于命中的集合,我們將更新其過期時間。
同時,我們數據的實時性也是一個問題,因為我們的集合是在生成集合時的Hash內容決定的,對于新插入到Hash的數據,集合是無法探知的,因此有兩種解決方案:
- 第一種是插入到Hash時同時再插入到其他相應的集合中,保證數據一直是最新的,這種方式需要增加特殊前綴用于識別,否則我們也不清楚到底要插入到哪些集合中。
- 第二種方式是定時更新,這種方式比較省力,但無法保證分頁數據的實時性。因此具體怎么選擇還是取決于業務場景。
總結
本文大概地描述了實現分頁和多條件模糊查詢的方案,希望能夠對大家有所幫助。