前言
NoSQL,泛指非關系型的數據庫。隨著互聯網不斷的發展,傳統的關系數據庫在應付新互聯網模式的網站,特別是超大規模和高并發的SNS類型的純動態網站已經顯得力不從心,暴露了很多難以克服的問題,而非關系型的數據庫則由于其本身的特點得到了非常迅速的發展。NoSQL數據庫的產生就是為了解決大規模數據集合多重數據種類帶來的挑戰,尤其是大數據應用難題。而今天主要講用得比較多的三個NoSQL:Memcached、redis、MongoDB。
Memcached
優點
1.Memcached可以利用多核優勢,單實例吞吐量極高,可以達到幾十萬QPS(取決于key、value的字節大小以及服務器硬件性能,日常環境中QPS高峰大約在4-6w左右)。適用于最大程度扛量。
2.支持直接配置為session handle。
缺點
1.只支持簡單的key/value數據結構,不像Redis可以支持豐富的數據類型。
2.無法進行持久化,數據不能備份,只能用于緩存使用,且重啟后數據全部丟失。
3.無法進行數據同步,不能將MC中的數據遷移到其他MC實例中。
4.Memcached內存分配采用Slab Allocation機制管理內存,value大小分布差異較大時會造成內存利用率降低,并引發低利用率時依然出現踢出等問題。需要用戶注重value設計。
Redis
優點
1.支持多種數據結構,如 string(字符串)、 list(雙向鏈表)、dict(hash表)、set(集合)、zset(排序set)、hyperloglog(基數估算)。
2.支持持久化操作,可以進行aof及rdb數據持久化到磁盤,從而進行數據備份或數據恢復等操作,較好的防止數據丟失的手段。
3.支持通過Replication進行數據復制,通過master-slave機制,可以實時進行數據的同步復制,支持多級復制和增量復制,master-slave機制是Redis進行HA的重要手段。
4.單線程請求,所有命令串行執行,并發情況下不需要考慮數據一致性問題。
5.支持pub/sub消息訂閱機制,可以用來進行消息訂閱與通知。
6.支持簡單的事務需求,但業界使用場景很少,并不成熟。
缺點
1.Redis只能使用單線程,性能受限于CPU性能,故單實例CPU最高才可能達到5-6wQPS每秒(取決于數據結構,數據大小以及服務器硬件性能,日常環境中QPS高峰大約在1-2w左右)。
2.支持簡單的事務需求,但業界使用場景很少,并不成熟,既是優點也是缺點。
3.Redis在string類型上會消耗較多內存,可以使用dict(hash表)壓縮存儲以降低內存耗用。
MongoDB
優點
1.更高的寫負載,MongoDB擁有更高的插入速度。
2.處理很大的規模的單表,當數據表太大的時候可以很容易的分割表。
3.高可用性,設置M-S不僅方便而且很快,MongoDB還可以快速、安全及自動化的實現節點(數據中心)故障轉移。
4.快速的查詢,MongoDB支持二維空間索引,比如管道,因此可以快速及精確的從指定位置獲取數據。MongoDB在啟動后會將數據庫中的數據以文件映射的方式加載到內存中。如果內存資源相當豐富的話,這將極大地提高數據庫的查詢速度。
5.非結構化數據的爆發增長,增加列在有些情況下可能鎖定整個數據庫,或者增加負載從而導致性能下降,由于MongoDB的弱數據結構模式,添加1個新字段不會對舊表格有任何影響,整個過程會非常快速。
缺點
1.不支持事務。
2.MongoDB占用空間過大 。
3.MongoDB沒有成熟的維護工具。
Memcached、Redis、MongoDB的區別
1.性能
三者的性能都比較高,總的來講:Memcached和Redis差不多,要高于MongoDB。
2.便利性
Memcached數據結構單一。
Redis豐富一些,數據操作方面,Redis更好一些,較少的網絡IO次數。
MongoDB支持豐富的數據表達,索引,最類似關系型數據庫,支持的查詢語言非常豐富。
3.存儲空間
Memcached可以修改最大可用內存,采用LRU算法。
Redis在2.0版本后增加了自己的VM特性,突破物理內存的限制;可以對key value設置過期時間(類似memcached)。
MongoDB適合大數據量的存儲,依賴操作系統VM做內存管理,吃內存也比較厲害,服務不要和別的服務在一起。
4.可用性
Memcached本身沒有數據冗余機制,也沒必要;對于故障預防,采用依賴成熟的hash或者環狀的算法,解決單點故障引起的抖動問題。
Redis,依賴客戶端來實現分布式讀寫;主從復制時,每次從節點重新連接主節點都要依賴整個快照,無增量復制,因性能和效率問題,所以單點問題比較復雜;不支持自動sharding,需要依賴程序設定一致hash 機制。一種替代方案是,不用redis本身的復制機制,采用自己做主動復制(多份存儲),或者改成增量復制的方式(需要自己實現),一致性問題和性能的權衡。
MongoDB支持master-slave,replicaset(內部采用paxos選舉算法,自動故障恢復),auto sharding機制,對客戶端屏蔽了故障轉移和切分機制。
5.可靠性
Memcached不支持,通常用在做緩存,提升性能。
Redis支持(快照、AOF):依賴快照進行持久化,aof增強了可靠性的同時,對性能有所影響。
MongoDB從1.8版本開始采用binlog方式支持持久化的可靠性。
6.一致性
Memcached在并發場景下,用cas保證一致性。
Redis事務支持比較弱,只能保證事務中的每個操作連續執行。
MongoDB不支持事務。
7.數據分析
MongoDB內置了數據分析的功能(mapreduce),其他兩者不支持。
8.應用場景
Memcached:用于在動態系統中減少數據庫負載,提升性能;做緩存,提高性能(適合讀多寫少,對于數據量比較大,可以采用sharding)。
Redis:數據量較小的高性能操作和運算上。
MongoDB:主要解決海量數據的訪問效率問題。
總結分析
1.若是簡單的存取key-value(主要是讀)這樣的數據用Memcached好一些。若是要支持數據持久化,量也不大,操作很頻繁,多數據類型(如集合、散列之類的),用列表類型做隊列之類的高級應用,就用Redis,但如果是數據量比較大時就采用MongoDB。
2.Memcached的很多客戶端更加成熟穩定,Redis協議比Memcached復雜。Redis不可能比Memcached快?但是測試結果基本是Redis占絕對優勢。
3.云數據庫Memcached版實例中的數據是存儲在內存中的,當出現宕機、機房斷電等意外,或是云數據庫Memcached版實例在正常升級維護時,內存中的數據均會丟失。因此,云數據庫Memcached版不能作為持久化的數據存儲服務使用。Redis的數據都存放在內存中,如果沒有配置持久化,Redis重啟后數據就全丟失了,于是需要開啟Redis的持久化功能,將數據保存到磁盤上,當Redis重啟后,可以從磁盤中恢復數據,實現持久化。
4.對于Redis和MongoDB來說,大家一般稱之為Redis緩存、MongoDB數據庫。Redis主要把數據存儲在內存中,其“緩存”的性質遠大于其“數據存儲“的性質,其中數據的增刪改查也只是像變量操作一樣簡單;MongoDB卻是一個“存儲數據”的系統,增刪改查可以添加很多條件,就像SQL數據庫一樣靈活。
5.MongoDB和Redis都是NoSQL,采用結構型數據存儲。二者在使用場景中,存在一定的區別,這也主要由于二者在內存映射的處理過程,持久化的處理方法不同。MongoDB建議集群部署,更多的考慮到集群方案,Redis更偏重于進程順序寫入,雖然支持集群,也僅限于主-從模式。