一、事物
事務(wù)是以可控的方式對數(shù)據(jù)資源進行訪問的一組操作。
二、事物的四個特征-ACID
要注意的是事務(wù)能夠通過AID來保證這個C的過程,C是目的,AID都是手段。
① Atomic原子性
事務(wù)必須是一個原子的操作序列集合,即可以是一個操作,也可以是多個操作。在這個事物執(zhí)行的過程中,要么全部成功,則整個事物全部成功,如果有一項失敗,則全部失敗,整個事物回滾。
② Consistency
指系統(tǒng)從一個正確的狀態(tài),遷移到另一個正確的狀態(tài)。即事物在執(zhí)行前后,數(shù)據(jù)庫都必須滿足一條系統(tǒng)設(shè)置的約束條件,它依賴于應(yīng)用層,也就是依賴于開發(fā)者。
③ Isolation
在并發(fā)的環(huán)境中,事物是相互隔離的,一個事物的執(zhí)行,不能被其他事物所影響。在沒有事物隔離的情況下可能會出現(xiàn):
- 臟讀:比如事務(wù)T1將更新一批結(jié)果,然后事務(wù)T2讀取該集合,此后T1因為某種原因而回滾之前的操作,這就導(dǎo)致了T2所讀取到的數(shù)據(jù)是無效的。
- 不可重復(fù)讀:比如事物T1訪問一批數(shù)據(jù)集并返回給應(yīng)用層后還沒有結(jié)束,事物T2也去訪問并更新該數(shù)據(jù)集,此時事物T1再去讀取該數(shù)據(jù)集,使得同一個事物多次讀取的同一數(shù)據(jù)集不同(重點在于修改數(shù)據(jù))。
- 幻讀:比如事物T1訪問數(shù)據(jù)集,并修改了數(shù)據(jù)某一列的值,使其符合某以約束條件,同時,事物T2也在修改這個數(shù)據(jù)集,往這個數(shù)據(jù)集上插入一行新數(shù)據(jù)(不符合之前的約束條件)。過一段時間后事物T1再次訪問數(shù)據(jù)集,發(fā)現(xiàn)還有未修改的數(shù)據(jù),出現(xiàn)幻覺一般。(重點在于新增或者刪除數(shù)據(jù))
四種隔離級別依次遞增:
(1). 讀未提交
事物沒有提交的過程中允許其他事物去更改數(shù)據(jù)集。(相當(dāng)于沒有隔離,易發(fā)生臟讀。)
(2). 讀已提交
只允許讀到已經(jīng)提交的數(shù)據(jù)。第一次讀原先的數(shù)據(jù),第二次讀其他事物修改后提交的數(shù)據(jù)(易發(fā)生不可重復(fù)讀)
(3). 可重復(fù)讀
保證在事務(wù)處理過程中,多次讀取同一個數(shù)據(jù)時,其值都和事務(wù)開始時刻時是一致的。這可以保證原先的數(shù)據(jù)是一致的,但不能保證新加入的數(shù)據(jù)是否正確。(易發(fā)生幻讀)
(4). 串行化
最嚴格的隔離級別,所有事物串行執(zhí)行,不存在并發(fā)的情況,
④ Durability
一旦事物被提交,則它對數(shù)據(jù)庫的操作將被永久保存,即使系統(tǒng)出現(xiàn)了宕機也可以進行恢復(fù)。
三、CAP定理
? 一個分布式系統(tǒng)不可能同時滿足一致性Consistency、可用性Availability、分區(qū)容錯性Partition tolerance這三個基本需求,最多只能同時滿足其中的兩項。
① 一致性Consistency
這個一致性和ACID的一致性不同,這里的一致性指的是多個副本之間在初始一致(完全相同)的條件下執(zhí)行一系列操作后,這些副本的數(shù)據(jù)仍然可以保持一致。
② 可用性Availability
系統(tǒng)可以提供正常的服務(wù),主要有兩個因素:響應(yīng)時間以及返回正確的結(jié)果集。
③ 分區(qū)容錯性Partition tolerance
分布式系統(tǒng)中即使出現(xiàn)了網(wǎng)絡(luò)分區(qū)的情況,仍然能夠滿足一致性和可用性。
網(wǎng)絡(luò)分區(qū),是指分布式系統(tǒng)中,不同的節(jié)點分布在不同的子網(wǎng)絡(luò)(機房/異地網(wǎng)絡(luò))中,由于一些特殊的原因?qū)е逻@些子網(wǎng)絡(luò)之間出現(xiàn)網(wǎng)絡(luò)不連通的狀態(tài),但各個子網(wǎng)絡(luò)的內(nèi)部網(wǎng)絡(luò)是正常的,從而導(dǎo)致整個系統(tǒng)的網(wǎng)絡(luò)環(huán)境被切分成了若干孤立的區(qū)域。組成一個分布式系統(tǒng)的每個節(jié)點的加入與退出都可以看做是一個特殊的網(wǎng)絡(luò)分區(qū)
三者取其二
- CA without P:這個時候就相當(dāng)于放棄了分布式系統(tǒng)的架構(gòu),放棄了系統(tǒng)的可擴展性,系統(tǒng)只在單機上運行。
- CP without A:如果不要求A(可用)。達到C(一致)需要P(分區(qū))通過網(wǎng)絡(luò)完全同步,會導(dǎo)致同步時間無限延長。
- AP wihtout C:要高可用并允許分區(qū),則需放棄一致性。一旦分區(qū)發(fā)生,節(jié)點之間可能會失去聯(lián)系,為了高可用,每個節(jié)點只能用本地數(shù)據(jù)提供服務(wù),而這樣會導(dǎo)致全局數(shù)據(jù)的不一致性。
對于分布式系統(tǒng)來說,P是不能放棄的(可以進行優(yōu)化),因此通常在可用性和一致性之間權(quán)衡。
四、BASE定理
Basically Available(基本可用)、Soft state(軟狀態(tài))、Eventually consistent(最終一致性)
- 基本可用(Basically Available)
- 基本可用是指分布式系統(tǒng)在出現(xiàn)不可預(yù)知的故障的時候,允許損失部分可用性,但不等于系統(tǒng)不可用。例如犧牲部分響應(yīng)時間、以及功能上的損失(高峰期,屏蔽一些功能使得服務(wù)降級)
- 軟狀態(tài)(Soft state)
- 與硬狀態(tài)相對,即是指允許系統(tǒng)中的數(shù)據(jù)存在中間狀態(tài),并認為該中間狀態(tài)的存在不會影響系統(tǒng)的整體可用性,即允許系統(tǒng)在不同節(jié)點的數(shù)據(jù)副本之間進行數(shù)據(jù)同步的過程存在延時。
- 最終一致性(Eventually consistent)
- 強調(diào)系統(tǒng)中所有的數(shù)據(jù)副本,在經(jīng)過一段時間的同步后,最終能夠達到一個一致的狀態(tài)。其本質(zhì)是需要系統(tǒng)保證最終數(shù)據(jù)能夠達到一致,而不需要實時保證系統(tǒng)數(shù)據(jù)的強一致性。
可以看出BASE定理是通過弱化一致性來獲得可用性,它允許數(shù)據(jù)在一段時間內(nèi)是不一致的,但通過一定的時間最終達到一致狀態(tài)。