如果您的系統依賴PostgreSQL數據庫并且您正在尋找HA的集群解決方案,我們希望提前告知您這是一項復雜的任務,但并非不可能實現。
我們將討論一些解決方案,您可以從中選擇對您的容錯要求。
PostgreSQL本身不支持任何多主群集解決方案,例如MySQL或Oracle。盡管如此,仍有許多商業和社區產品提供此實現,以及其他產品,例如PostgreSQL的復制或負載平衡。
首先,讓我們回顧一些基本概念:
什么是高可用性?
它是服務可用的時間量,通常由企業定義。
冗余是高可用性的基礎;萬一發生事故,我們可以繼續毫無問題地運轉。
持續恢復
如果發生事件,則必須還原備份,然后應用wal日志;恢復時間將非常長,我們不會談論高可用性。
但是,如果我們將備份和日志存檔在應急服務器中,則可以在日志到達時應用它們。
如果日志每隔1分鐘發送和應用一次,則應急基礎將處于連續恢復狀態,并且到生產的時間最多為1分鐘。
備用數據庫
備用數據庫的想法是保留生產數據庫的副本,該副本始終具有相同的數據,并且可以在發生事件時使用。
有幾種方法可以對備用數據庫進行分類:
根據復制的性質:
- 物理備用數據庫:復制磁盤塊。
- 邏輯備用數據庫:流式傳輸數據更改。
通過事務的同步性:
- 異步:可能會丟失數據。
- 同步:不會丟失數據;主服務器中的提交等待備用服務器的響應。
通過用法:
- 熱備用:它們不支持連接。
- 熱備用:支持只讀連接。

集群
群集是一組一起工作的主機,被視為一個主機。
這提供了一種實現水平可伸縮性的方法,并提供了通過添加服務器來處理更多工作的能力。
它可以抵抗節點的故障并繼續透明地工作。
根據共享的內容,有兩種模型:

- 共享存儲:所有節點都使用相同的信息訪問相同的存儲。
- 不共享:每個節點都有自己的存儲,取決于我們系統的結構,該存儲可能與其他節點具有相同的信息。
現在讓我們回顧一下PostgreSQL中的一些集群選項。
分布式復制塊設備 (Distributed Replicated Block Device)
DRBD是一個linux內核模塊,可使用網絡實現同步塊復制。 它實際上不實現群集,也不處理故障轉移或監視。 為此,您需要補充軟件,例如Corosync + Pacemaker + DRBD。

例:
- Corosync:處理主機之間的消息。
- Pacemaker:啟動和停止服務,確保它們僅在一臺主機上運行。
- DRBD:在塊設備級別同步數據。

集群控制(ClusterControl)
ClusterControl是用于數據庫集群的無代理管理和自動化軟件。 它可直接從其用戶界面幫助部署,監視,管理和擴展數據庫服務器/集群。
ClusterControl能夠處理維護數據庫服務器或群集所需的大多數管理任務。

使用ClusterControl,您可以:
- 在您選擇的技術堆棧上部署獨立的,復制的或群集的數據庫。
- 跨多語言數據庫和動態基礎架構統一自動化故障轉移,恢復和日常任務。
- 您可以創建完整或增量備份并計劃它們。
- 對整個數據庫和服務器基礎結構進行統一和全面的實時監控。
- 只需一個操作即可輕松添加或刪除節點。
在PostgreSQL上,如果發生事件,可以自動將您的從屬提升為主狀態。
它是一個非常完整的工具,帶有免費的社區版本(還包括免費的企業試用版)。


紅寶石 (Rubyrep)
異步,多主機,多平臺復制(在Ruby或JRuby中實現)和多DBMS(MySQL或PostgreSQL)的解決方案。
基于觸發器,它不支持DDL,用戶或授權。
使用和管理的簡單性是其主要目標。
一些功能:
- 配置簡單
- 安裝簡單
- 平臺獨立,表格設計獨立。
Pgpool II
它是一種在PostgreSQL服務器和PostgreSQL數據庫客戶端之間工作的中間件。
一些功能:
- 連接池
- 復寫
- 負載均衡
- 自動故障轉移
- 并行查詢

Bucardo
基于行的異步級聯主從復制,使用觸發器在數據庫中排隊;基于行的異步主-主復制,基于行,使用觸發器和自定義沖突解決方案。
Bucardo需要專用的數據庫并作為Perl守護程序運行,該守護程序與此數據庫以及復制中涉及的所有其他數據庫進行通信。它可以作為多主機或多從機運行。
主從復制涉及到一個或多個目標的一個或多個源。源必須是PostgreSQL,但是目標可以是PostgreSQL,MySQL,redis,Oracle,MariaDB,SQLite或MongoDB。
一些功能:
- 負載均衡
- 從站不受限制,可以寫
- 部分復制
- 按需復制(更改可以自動或在需要時推送)
- 從站可以“預熱”以快速設置
缺點:
- 無法處理DDL
- 無法處理大物件
- 沒有唯一鍵無法增量復制表
- 不適用于Postgres 8之前的版本
Postgres-XC
Postgres-XC是一個開源項目,旨在提供可寫擴展,同步,對稱和透明的PostgreSQL集群解決方案。它是緊密耦合的數據庫組件的集合,可以將其安裝在多個硬件或虛擬機中。
寫可伸縮性意味著Postgres-XC可以配置任意數量的數據庫服務器,并且與單個數據庫服務器相比,可以處理更多的寫操作(更新SQL語句)。
您可以有多個客戶端連接到的數據庫服務器,該服務器提供數據庫的單個一致的群集范圍視圖。
來自任何數據庫服務器的任何數據庫更新對于在不同主服務器上運行的任何其他事務都是立即可見的。
透明意味著您不必擔心內部如何將數據存儲在多個數據庫服務器中。
您可以配置Postgres-XC在多個服務器上運行。您為每個表選擇的數據以分布式方式存儲,即分區或復制。發出查詢時,Postgres-XC會確定目標數據的存儲位置,并向包含目標數據的服務器發出相應的查詢。

Citus
Citus用內置的高可用性功能(例如自動分片和復制)替代了PostgreSQL。 Citus分片將您的數據庫分片,并在整個商品節點集群中復制每個分片的多個副本。如果群集中的任何節點不可用,Citus會將所有寫入或查詢透明地重定向到其他一個包含受影響的分片副本的節點。
一些功能:
- 自動邏輯分片
- 內置復制
- 用于災難恢復的數據中心感知復制
- 具有高級負載平衡功能的中查詢容錯
您可以增加由PostgreSQL支持的實時應用程序的正常運行時間,并最大程度地減少硬件故障對性能的影響。您可以使用內置的高可用性工具來實現此目標,從而最大程度地減少成本高昂且易于出錯的手動干預。
PostgresXL
它是一種無共享的多主群集解決方案,可以透明地在一組節點上分配表,并并行執行這些節點的查詢。它具有一個稱為全局事務管理器(GTM)的附加組件,用于提供群集的全局一致視圖。該項目基于PostgreSQL 9.5版本。一些公司,例如2ndQuadrant,為該產品提供商業支持。
PostgresXL是可水平擴展的開源SQL數據庫集群,具有足夠的靈活性來處理各種數據庫工作負載:
- OLTP寫密集型工作負載
- 需要MPP并行性的商業智能
- 運營數據存儲
- 鍵值存儲
- GIS地理空間
- 混合工作負載環境
- 多租戶提供商托管環境
組件:
- 全局事務監視器(GTM):全局事務監視器確保群集范圍內的事務一致性。
- 協調器:協調器管理用戶會話并與GTM和數據節點進行交互。
- 數據節點:數據節點是存儲實際數據的位置。
結論
還有許多其他產品可以為PostgreSQL創建我們的高可用性環境,但是您必須注意以下幾點:
- 新產品,未經充分測試
- 停產項目
- 局限性
- 許可費用
- 非常復雜的實現
- 不安全的解決方案
您還必須考慮您的基礎架構。如果只有一臺應用程序服務器,那么無論您配置了多少數據庫的高可用性,如果應用程序服務器發生故障,則將無法訪問。您必須很好地分析基礎架構中的單點故障,并嘗試解決它們。
考慮到這些要點,您可以找到一種適合您的需求和要求的解決方案,而不會產生麻煩,并且能夠實施您的高可用性群集解決方案。來吧,祝你好運!
原文:
https://severalnines.com/database-blog/top-pg-clustering-high-availability-ha-solutions-postgresql
本文:
http://jiagoushi.pro/top-pg-clustering-high-availability-ha-solutions-postgresql
討論:請加入知識星球或者微信圈子【首席架構師圈】