Zookeeper 面試總結(jié)-魔扣目錄

一、zk是什么：

1、個人理解zk=文件系統(tǒng)+通知機制。

2、zk是一個分布式的應(yīng)用程序協(xié)調(diào)服務(wù)，我理解的就是有兩臺集器A、B，A對一個數(shù)據(jù)進(jìn)行了操作，B是如何知道的，這個就需要zk的支持。

3、分布式應(yīng)用程序可以基于 ZooKeeper 實現(xiàn)諸如數(shù)據(jù)發(fā)布/訂閱、負(fù)載均衡、命名服務(wù)、分布式協(xié) 調(diào)/通知、集群管理、Master 選舉、配置維護(hù)，名字服務(wù)、分布式同步、分布式鎖和分布式隊列等功能。

二、zk的初始化選舉機制：

1、首先一般選舉里面都有2N+1臺集器，如果是三臺機器的A、B、C，A和B都會選舉自己，每次投票會包括推舉的服務(wù)器的myid和zxid，使用（myid，zxid）來表示。

2、集群中的服務(wù)器都接受到投票時，首先判斷投票的有效性，如檢查是不是本輪的投票，是否是looking狀態(tài)的機器。

3、處理投票，比較zxid大小，越大權(quán)重越大，如果相同再比較myid。

4、統(tǒng)計投票。

5、改變服務(wù)器的狀態(tài)。

ps：注意：在這個過程中，有個重要的數(shù)據(jù)結(jié)構(gòu)，electionEpoch即邏輯時鐘，用來判斷是否在同一輪選舉周期中，每次進(jìn)入新的一輪投票都會自增，還有一個state，表示當(dāng)前服務(wù)器的狀態(tài)。

三、zk的運行過程中l(wèi)eader崩潰選舉機制：

1、狀態(tài)變更，余下所有的observing服務(wù)器都會將自己的服務(wù)器狀態(tài)變成looking狀態(tài)。

2、每個server會發(fā)起投票。

3、接受各個服務(wù)器的投票。

4、處理投票。

5、統(tǒng)計投票。

6、改變服務(wù)器的狀態(tài)。

注意：其實崩潰選舉機制和初始化差不多，但是值得注意一點是每個機器中的electionEpoch，也就是邏輯時鐘，如果有機器宕機的話，這個數(shù)值是和正常的機器不一樣的，所以需要判斷這個值不是正常值的機器投票數(shù)據(jù)是否是正常的。

四、zk中的znode節(jié)點：

1、四種類型：（1）、持久化目錄節(jié)點。（2）、持久化順序編號目錄節(jié)點。（3）、臨時目錄節(jié)點。（4）、臨時順序編號目錄節(jié)點。

五、zk中的監(jiān)控原理：

1、zk類似于linux中的目錄節(jié)點樹方式的數(shù)據(jù)存儲，即分層命名空間，zk并不是專門存儲數(shù)據(jù)的，它的作用是主要是維護(hù)和監(jiān)控存儲數(shù)據(jù)的狀態(tài)變化，通過監(jiān)控這些數(shù)據(jù)狀態(tài)的變化，從而可以達(dá)到基于數(shù)據(jù)的集群管理，zk中的杰點的數(shù)據(jù)上限時1M。

2、zk中的wathc機制：client端會對某個znode建立一個watcher事件，當(dāng)該znode發(fā)生變化時，這些client會收到zk的通知，然后client可以根據(jù)znode變化來做出業(yè)務(wù)上的改變等。

3、圖說明：

4、main方法會創(chuàng)建zkClient，在創(chuàng)建zkClient的時候，會創(chuàng)建出listener進(jìn)程和connect進(jìn)程。一個是監(jiān)控進(jìn)程一個是網(wǎng)絡(luò)連接進(jìn)程。當(dāng)zkClient調(diào)用getChildren等方法注冊監(jiān)聽器的時候，connect進(jìn)程向zk注冊監(jiān)聽器，注冊后的緝監(jiān)聽器位于zk的監(jiān)聽器列表中，監(jiān)聽器列表中記錄了zkClient的ip地址，端口號，要監(jiān)控的目錄，一旦目標(biāo)文件發(fā)生了改變，zk就會把這條消息發(fā)送給對應(yīng)的zkClient的listener進(jìn)程，listener進(jìn)程接受到后，就會執(zhí)行process方法。在process方法中針對發(fā)生的事件進(jìn)行處理。

六、zk的職者：

1、命名服務(wù)：命名服務(wù)是指通過指定的名字來獲取資源或者服務(wù)的地址，利用zk創(chuàng)建一個全局的路徑，即是唯一的路徑，這個路徑就可以作為一個名字，指向集群中的集群，提供的服務(wù)的地址，或者一個遠(yuǎn)程的對象等等。

2、配置管理（文件系統(tǒng)、通知機制）：程序分布式的部署在不同的機器上，將程序的配置信息放在zk的znode下，當(dāng)有配置發(fā)生改變時，也就是znode發(fā)生變化時，可以通過改變zk中某個目錄節(jié)點的內(nèi)容，利用watcher通知給各個客戶端，從而更改配置。

3、集群管理：是否有機器退出和加入、選舉master。對于機器的退出，所有機器約定在父目錄下創(chuàng)建臨時目錄，對于新機器的加入，所有機器創(chuàng)建臨時順序編號目錄節(jié)點。

4、分布式鎖：分為兩類，一個是保持獨占：客戶端需要的時候，就去通過createznode的方式實現(xiàn)，所有客戶端都去創(chuàng)建/distribute_lock節(jié)點，用完就刪除節(jié)點就行了。一個是控制時序，/distribute_lock已經(jīng)預(yù)先存在，所有客戶端在它下面創(chuàng)建臨時順序編號目錄節(jié)點。主要流程是：客戶端在獲取分布式鎖的時候在locker節(jié)點下創(chuàng)建臨時順序節(jié)點，釋放鎖的時候就刪除，客戶端首先調(diào)用createZnode放在在locker創(chuàng)建臨時順序節(jié)點，然后調(diào)用getChildren來獲取locker下面的所有子節(jié)點，此時不用設(shè)置watch，客戶端獲取了所有子節(jié)點的path之后，反正最后要找到最小序號的那個節(jié)點，調(diào)用exist方法，同時對其注冊事件監(jiān)聽器

5、隊列管理：兩種類型的隊列，一種是同步隊列，一個是按照FIFO方式進(jìn)行入隊和出隊，第二種保證了隊列消息的不會丟失，因為會在特定的目錄下創(chuàng)建一個persistent_sequential節(jié)點，創(chuàng)建成功時watcher通知等待的隊列，隊列刪除序列號最小的節(jié)點，此場景下，zk中的znode用于消息存儲，znode存儲的數(shù)據(jù)就是消息隊列中的消息內(nèi)容，sequential序列號就是消息的編號，按序列取出即可。

七、zk中的數(shù)據(jù)復(fù)制：

1、作用：（1）容錯。（2）提高系統(tǒng)的擴展功能。（3）提高性能。

2、數(shù)據(jù)復(fù)制分為兩種：

（1）、寫主，對數(shù)據(jù)的修改提交給指定節(jié)點，讀沒有限制，可以在任意的節(jié)點讀取數(shù)據(jù)。

（2）、寫任意：對數(shù)據(jù)的修改提交給任意的節(jié)點，讀也是任意節(jié)點。

八、zk的工作原理：

1、核心就是原子廣播。在ZooKeeper中所有的事務(wù)請求都由一個主服務(wù)器也就是Leader來處理，其他服務(wù)器為Follower，Leader將客戶端的事務(wù)請求轉(zhuǎn)換為事務(wù)Proposal，并且將Proposal分發(fā)給集群中其他所有的Follower，然后Leader等待Follwer反饋，當(dāng)有過半數(shù)（>=N/2+1）的Follower反饋信息后，Leader將再次向集群內(nèi)Follower廣播Commit信息，Commit為將之前的Proposal提交。

2、保證數(shù)據(jù)的一致性：

（1）、順序的一致性。

（2）、原子性。

（3）、單一的系統(tǒng)映像。

（4）、持久性。

3、ZAB協(xié)議的兩種實現(xiàn)方式：

（1）、恢復(fù)模式：當(dāng)服務(wù)啟動或在leader崩潰后，ZAB就進(jìn)入了恢復(fù)模式，在leader選舉出來之前，且大多數(shù)server完成和leader的狀態(tài)同步以后，恢復(fù)模式就結(jié)束了。在這個過程中，要保證被leader提交的proposal最終被所有的follower執(zhí)行，確保那些只在leader提出的proposal被丟棄。

（2）、廣播模式：即leader提出一個決議，由follower進(jìn)行投票，leader對投票結(jié)果進(jìn)行計算決定是否通過決議，如果通過執(zhí)行該決議，否則什么都不做。