Redis：緩存被我寫滿了，該怎么辦？

介紹

redis是一個內存數據庫，當Redis使用的內存超過物理內存的限制后，內存數據會和磁盤產生頻繁的交換，交換會導致Redis性能急劇下降。所以在生產環境中我們通過配置參數maxmemoey來限制使用的內存大小。

當實際使用的內存超過maxmemoey后，Redis提供了如下幾種可選策略。

noeviction：寫請求返回錯誤

volatile-lru：使用lru算法刪除設置了過期時間的鍵值對 volatile-lfu：使用lfu算法刪除設置了過期時間的鍵值對 volatile-random：在設置了過期時間的鍵值對中隨機進行刪除 volatile-ttl：根據過期時間的先后進行刪除，越早過期的越先被刪除

allkeys-lru：在所有鍵值對中，使用lru算法進行刪除 allkeys-lfu：在所有鍵值對中，使用lfu算法進行刪除 allkeys-random：所有鍵值對中隨機刪除

我們來詳細了解一下lru和lfu算法，這是2個常見的緩存淘汰算法。「因為計算機緩存的容量是有限的，所以我們要刪除那些沒用的數據，而這兩種算法的區別就是判定沒用的緯度不一樣。」

LRU算法

「lru（Least recently used，最近最少使用）算法，即最近訪問的數據，后續很大概率還會被訪問到，即是有用的。而長時間未被訪問的數據，應該被淘汰」

lru算法中數據會被放到一個鏈表中，鏈表的頭節點為最近被訪問的數據，鏈表的尾節點為長時間沒有被訪問的數據

「lru算法的核心實現就是哈希表加雙向鏈表」。鏈表可以用來維護訪問元素的順序，而hash表可以幫我們在O(1)時間復雜度下訪問到元素。

「至于為什么是雙向鏈表呢」？主要是要刪除元素，所以要獲取前繼節點。數據結構圖示如下

使用雙向鏈表+HashMap

雙向鏈表節點定義如下

public class ListNode<K, V> {
    K key;
    V value;
    ListNode pre;
    ListNode next;

    public ListNode() {}

    public ListNode(K key, V value) {
        this.key = key;
        this.value = value;
    }
}

封裝雙向鏈表的常用操作

public class DoubleList {

    private ListNode head;
    private ListNode tail;

    public DoubleList() {
        head = new ListNode();
        tail = new ListNode();
        head.next = tail;
        tail.pre = head;
    }

    public void remove(ListNode node) {
        node.pre.next = node.next;
        node.next.pre = node.pre;
    }

    public void addLast(ListNode node) {
        node.pre = tail.pre;
        tail.pre = node;
        node.pre.next = node;
        node.next = tail;
    }

    public ListNode removeFirst() {
        if (head.next == tail) {
            return null;
        }
        ListNode first = head.next;
        remove(first);
        return first;
    }
}

封裝一個緩存類，提供最基本的get和put方法。「需要注意，這兩種基本的方法都涉及到對兩種數據結構的修改」。

public class MyLruCache<K, V> {

    private int capacity;
    private DoubleList doubleList;
    private Map<K, ListNode> map;

    public MyLruCache(int capacity) {
        this.capacity = capacity;
        map = new HashMap<>();
        doubleList = new DoubleList();
    }

    public V get(Object key) {
        ListNode<K, V> node = map.get(key);
        if (node == null) {
            return null;
        }
        // 先刪除該節點，再接到尾部
        doubleList.remove(node);
        doubleList.addLast(node);
        return node.value;
    }

    public void put(K key, V value) {
        // 直接調用這邊的get方法，如果存在，它會在get內部被移動到尾巴，不用再移動一遍,直接修改值即可
        if ((get(key)) != null) {
            map.get(key).value = value;
            return;
        }

        // 如果超出容量，把頭去掉
        if (map.size() == capacity) {
            ListNode listNode = doubleList.removeFirst();
            map.remove(listNode.key);
        }

        // 若不存在，new一個出來
        ListNode node = new ListNode(key, value);
        map.put(key, node);
        doubleList.addLast(node);
    }
}

這里我們的實現為最近訪問的放在鏈表的尾節點，不經常訪問的放在鏈表的頭節點

測試一波，輸出為鏈表的正序輸出（代碼為了簡潔沒有貼toString方法）

MyLruCache<String, String> myLruCache = new MyLruCache<>(3);
// {5 : 5}
myLruCache.put("5", "5");
// {5 : 5}{3 : 3}
myLruCache.put("3", "3");
// {5 : 5}{3 : 3}{4 : 4}
myLruCache.put("4", "4");
// {3 : 3}{4 : 4}{2 : 2}
myLruCache.put("2", "2");
// {4 : 4}{2 : 2}{3 : 3}
myLruCache.get("3");

「因為LinkedHashMap的底層實現就是哈希表加雙向鏈表，所以你可以用LinkedHashMap替換HashMap和DoubleList來改寫一下上面的類」。

我來演示一下更騷的操作，只需要重寫一個構造函數和removeEldestEntry方法即可。

使用LinkedHashMap實現LRU

public class LruCache<K, V> extends LinkedHashMap<K, V> {

    private int cacheSize;


    public LruCache(int cacheSize) {
        /**
         * initialCapacity: 初始容量大小
         * loadFactor: 負載因子
         * accessOrder: false基于插入排序（默認），true基于訪問排序
         */
        super(cacheSize, 0.75f, true);
        this.cacheSize = cacheSize;
    }

    /**
     * 當調用put或者putAll方法時會調用如下方法，是否刪除最老的數據，默認為false
     */
    @Override
    protected boolean removeEldestEntry(Map.Entry<K, V> eldest) {
        return size() > cacheSize;
    }
}

注意這個緩存并不是線程安全的，可以調用Collections.synchronizedMap方法返回線程安全的map

LruCache<String, String> lruCache = new LruCache(3);
Map<String, String> safeMap = Collections.synchronizedMap(lruCache);

Collections.synchronizedMap實現線程安全的方式很簡單，只是返回一個代理類。代理類對Map接口的所有方法加鎖

public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) {
    return new SynchronizedMap<>(m);
}

LFU算法

「LRU算法有一個問題，當一個長時間不被訪問的key，偶爾被訪問一下后，可能會造成一個比這個key訪問更頻繁的key被淘汰。」

即LRU算法對key的冷熱程度的判斷可能不準確。而LFU算法（Least Frequently Used，最不經常使用）則是按照訪問頻率來判斷key的冷熱程度的，每次刪除的是一段時間內訪問頻率較低的數據，比LRU算法更準確。

使用3個hash表實現lfu算法

那么我們應該如何組織數據呢？

為了實現鍵值的對快速訪問，用一個map來保存鍵值對

private HashMap<K, Integer> keyToFreq;

還需要用一個map來保存鍵的訪問頻率

private HashMap<K, Integer> keyToFreq;

「當然你也可以把值和訪問頻率封裝到一個類中，用一個map來替代上述的2個map」

接下來就是最核心的部分，刪除訪問頻率最低的數據。

為了能在O(1)時間復雜度內找到訪問頻率最低的數據，我們需要一個變量minFreq記錄訪問最低的頻率
每個訪問頻率有可能對應多個鍵。當空間不夠用時，我們要刪除最早被訪問的數據，所以需要如下數據結構，Map<頻率, 有序集合>。每次內存不夠用時，刪除有序集合的第一個元素即可。并且這個有序集合要能快速刪除某個key，因為某個key被訪問后，需要從這個集合中刪除，加入freq+1對應的集合中
有序集合很多，但是能滿足快速刪除某個key的只有set，但是set插入數據是無序的。「幸虧JAVA有LinkedHashSet這個類，鏈表和集合的結合體，鏈表不能快速刪除元素，但是能保證插入順序。集合內部元素無序，但是能快速刪除元素，完美」

下面就是具體的實現。

public class LfuCache<K, V> {

    private HashMap<K, V> keyToVal;
    private HashMap<K, Integer> keyToFreq;
    private HashMap<Integer, LinkedHashSet<K>> freqTokeys;

    private int minFreq;
    private int capacity;

    public LfuCache(int capacity) {
        keyToVal = new HashMap<>();
        keyToFreq = new HashMap<>();
        freqTokeys = new HashMap<>();
        this.capacity = capacity;
        this.minFreq = 0;
    }

    public V get(K key) {
        V v = keyToVal.get(key);
        if (v == null) {
            return null;
        }
        increaseFrey(key);
        return v;
    }

    public void put(K key, V value) {
        // get方法里面會增加頻次
        if (get(key) != null) {
            // 重新設置值
            keyToVal.put(key, value);
            return;
        }

        // 超出容量，刪除頻率最低的key
        if (keyToVal.size() >= capacity) {
            removeMinFreqKey();
        }

        keyToVal.put(key, value);
        keyToFreq.put(key, 1);
        // key對應的value存在，返回存在的key
        // key對應的value不存在，添加key和value
        freqTokeys.putIfAbsent(1, new LinkedHashSet<>());
        freqTokeys.get(1).add(key);
        this.minFreq = 1;
    }

    // 刪除出現頻率最低的key
    private void removeMinFreqKey() {
        LinkedHashSet<K> keyList = freqTokeys.get(minFreq);
        K deleteKey = keyList.iterator().next();
        keyList.remove(deleteKey);
        if (keyList.isEmpty()) {
            // 這里刪除元素后不需要重新設置minFreq
            // 因為put方法執行完會將minFreq設置為1
            freqTokeys.remove(keyList);
        }
        keyToVal.remove(deleteKey);
        keyToFreq.remove(deleteKey);
    }

    // 增加頻率
    private void increaseFrey(K key) {
        int freq = keyToFreq.get(key);
        keyToFreq.put(key, freq + 1);
        freqTokeys.get(freq).remove(key);
        freqTokeys.putIfAbsent(freq + 1, new LinkedHashSet<>());
        freqTokeys.get(freq + 1).add(key);
        if (freqTokeys.get(freq).isEmpty()) {
            freqTokeys.remove(freq);
            // 最小頻率的set為空，key被移動到minFreq+1對應的set了
            // 所以minFreq也要加1
            if (freq == this.minFreq) {
                this.minFreq++;
            }
        }
    }
}

測試一下

LfuCache<String, String> lfuCache = new LfuCache(2);
lfuCache.put("1", "1");
lfuCache.put("2", "2");
// 1
System.out.println(lfuCache.get("1"));
lfuCache.put("3", "3");
// 1的頻率為2，2和3的頻率為1，但2更早之前被訪問，所以被清除
// 結果為null
System.out.println(lfuCache.get("2"));