當前位置:首頁 > 公眾號精選 > 程序員小灰
[導讀]對于分布式事務,相信所有人都應該很了解,為什么會有分布式事務?

對于分布式事務,相信所有人都應該很了解,為什么會有分布式事務?無論是數據量導致的分庫,還是現在微服務盛行的場景都是他出現的原因。

這一篇內容還是避免不了俗套,主要的范圍無非是XA、2PC、3PC、TCC,再最后到Seata。

但是,我認為這東西,只是適用于面試和理論的了解,你真要說這些方案實際生產中有人用嗎?

有,但是會實現的更簡單,不會套用理論來實現,大廠有大廠的解決方案,中小公司用框架或者壓根就不存在分布式事務的問題。

那,為什么還要寫這個?

為了你面試八股文啊,小可愛。

事務

要說分布式事務,首先還是從事務的基本特征說起。

A原子性:在事務的執(zhí)行過程中,要么全部執(zhí)行成功,要么都不成功。

C一致性:事務在執(zhí)行前后,不能破壞數據的完整性。一致性更多的說的是通過AID來達到目的,數據應該符合預先的定義和約束,由應用層面來保證,還有的說法是C是強行為了ACID湊出來的。

I隔離性:多個事務之間是互相隔離的,事務之間不能互相干擾,涉及到不同事務的隔離級別的問題。

D持久性:一旦事務提交,數據庫中數據的狀態(tài)就應該是永久性的。

XA

XA(eXtended Architecture)是指由X/Open 組織提出的分布式事務處理的規(guī)范,他是一個規(guī)范或者說是協(xié)議,定義了事務管理器TM(Transaction Manager),資源管理器RM(Resource Manager),和應用程序。

事務管理器TM就是事務的協(xié)調者,資源管理器RM可以認為就是一個數據庫。

2PC

XA定義了規(guī)范,那么2PC和3PC就是他的具體實現方式。

2PC叫做二階段提交,分為投票階段和執(zhí)行階段兩個階段。

投票階段

TM向所有的參與者發(fā)送prepare請求,詢問是否可以執(zhí)行事務,等待各個參與者的響應。

這個階段可以認為只是執(zhí)行了事務的SQL語句,但是還沒有提交。

如果都執(zhí)行成功了就返回YES,否則返回NO。

執(zhí)行階段

執(zhí)行階段就是真正的事務提交的階段,但是要考慮到失敗的情況。

如果所有的參與者都返回YES,那么就執(zhí)行發(fā)送commit命令,參與者收到之后執(zhí)行提交事務。

反之,只要有任意一個參與者返回的是NO的話,就發(fā)送rollback命令,然后執(zhí)行回滾的操作。

2PC的缺陷

  1. 同步阻塞,可以看到,在執(zhí)行事務的過程當中,所有數據庫的資源都被鎖定,如果這時候有其他人來訪問這些資源,將會被阻塞,這是一個很大的性能問題。
  2. TM單點問題,只要一個TM,一旦TM宕機,那么整個流程無法繼續(xù)完成。
  3. 數據不一致,如果在執(zhí)行階段,參與者腦裂或者其他故障導致沒有收到commit請求,部分提交事務,部分未提交,那么數據不一致的問題就產生了。

3PC

既然2PC有這么多問題,所以就衍生出了3PC的概念,也叫做三階段提交,他把整個流程分成了CanCommit、PreCommit、DoCommit三個步驟,相比2PC,增加的就是CanCommit階段。

CanCommit

這個階段就是先詢問數據庫是否執(zhí)行事務,發(fā)送一個canCommit的請求去詢問,如果可以的話就返回YES,反之返回NO。

PreCommit

這個階段就等同于2PC的投票階段了,發(fā)送preCommit命令,然后去執(zhí)行SQL事務,成功就返回YES,反之返回NO。

但是,這個地方的區(qū)別在于參與者有了超時機制,如果參與者超時未收到doCommit命令的話,將會默認去提交事務。

DoCommit

DoCommit階段對應到2PC的執(zhí)行階段,如果上一個階段都是收到YES的話,那么就發(fā)送doCommit命令去提交事務,反之則會發(fā)送abort命令去中斷事務的執(zhí)行。

相比2PC的改進

對于2PC的同步阻塞的問題,我們可以看到因為3PC加入了參與者的超時機制,所以原來2PC的如果某個參與者故障導致的同步阻塞的問題時間縮短了,這是一個優(yōu)化,但是并沒有完全避免。

第二個單點故障的問題,同樣因為超時機制的引入,一定程度上也算是優(yōu)化了。

但是數據不一致的問題,這個始終沒有得到解決。

舉個栗子:

在PreCommit階段,某個參與者發(fā)生腦裂,無法收到TM的請求,這時候其他參與者執(zhí)行abort事務回滾,而腦裂的參與者超時之后繼續(xù)提交事務,還是有可能發(fā)生數據不一致的問題。

那么,為什么要加入DoCommit這個階段呢?就是為了引入超時機制,事先我們先確認數據庫是否都可以執(zhí)行事務,如果都OK,那么才會進入后面的步驟,所以既然都可以執(zhí)行,那么超時之后說明發(fā)生了問題,就自動提交事務。

TCC

TCC的模式叫做Try、Confirm、Cancel,實際上也就是2PC的一個變種而已。

實現這個模式,一個事務的接口需要拆分成3個,也就是Try預占、Confirm確認提交、最后Cancel回滾。

對于TCC來說,實際生產我基本上就沒看見過有人用,考慮到原因,首先是程序員的本身素質參差不齊,多個團隊協(xié)作你很難去約束別人按照你的規(guī)則來實現,另外一點就是太過于復雜。

如果說有簡單的應用的話,庫存的應用或許可以算做是一個。

一般庫存的操作,很多實現方案里面都會會在下單的時候先預占庫存,下單成功之后再實際去扣減庫存,最終如果發(fā)生了異常再回退。

凍結、預占庫存就是2PC的準備階段,真正下單成功去扣減庫存就是2PC的提交階段,回滾就是某個發(fā)生異常的回滾操作,只不過在應用層面來實現了2PC的機制而已。

SAGA

Saga源于1987 年普林斯頓大學的 Hecto 和 Kenneth 發(fā)表的如何處理 long lived transaction(長活事務)論文。

主要思想就是將長事務拆分成多個本地短事務。

如果全部執(zhí)行成功,就正常完成了,反之,則會按照相反的順序依次調用補償。

SAGA模式有兩種恢復策略:

  1. 向前恢復,這個模式偏向于一定要成功的場景,失敗則會進行重試
  2. 向后恢復,也就是發(fā)生異常的子事務依次回滾補償

由于這個模式在國內基本沒看見有誰用的,不在贅述。

消息隊列

基于消息隊列來實現最終一致性的方案,這個相比前面的我個人認為還稍微靠譜一點,那些都是理論啊,正常生產的實現很少看見應用。

基于消息隊列的可能真正在應用的還稍微多一點。

一般來說有兩種方式,基于本地消息表和依賴MQ本身的事務消息。

本地消息表的這個方案其實更復雜,實際上我也沒看到過真正誰來用。這里我以RocketMQ的事務消息來舉例,這個方式相比本地消息表則更完全依賴MQ本身的特性做了解耦,釋放了業(yè)務開發(fā)的復雜工作量。

  1. 業(yè)務發(fā)起方,調用遠程接口,向MQ發(fā)送一條半事務消息,MQ收到消息之后會返回給生產者一個ACK
  2. 生產者收到ACK之后,去執(zhí)行事務,但是事務還沒有提交。
  3. 生產者會根據事務的執(zhí)行結果來決定發(fā)送commit提交或者rollback回滾到MQ
  4. 這一點是發(fā)生異常的情況,比如生產者宕機或者其他異常導致MQ長時間沒有收到commit或者rollback的消息,這時候MQ會發(fā)起狀態(tài)回查。
  5. MQ如果收到的是commit的話就會去投遞消息,消費者正常消費消息即可。如果是rollback的話,則會在設置的固定時間期限內去刪除消息。

這個方案基于MQ來保證消息事務的最終一致性,還算是一個比較合理的解決方案,只要保證MQ的可靠性就可以正常實施應用,業(yè)務消費方根據本身的消息重試達到最終一致性。

框架

以上說的都是理論和自己實現的方式,那么分布式事務就沒有框架來解決我們的問題嗎?

有,其實還不少,但是沒有能扛旗者出現,要說有,阿里的開源框架Seata還有阿里云的GTS。

GTS(Global Transaction Service 全局事務服務)是阿里云的中間件產品,只要你用阿里云,付錢就可以用GTS。

Seata(Simple Extensible Autonomous Transaction Architecture)則是開源的分布式事務框架,提供了對TCC、XA、Saga以及AT模式的支持。

那么,GTS和Seata有什么關系呢?

實際上最開始的時候他們都是基于阿里內部的TXC(Taobao Transaction Constructor)分布式中間件產品,然后TXC經過改造上了阿里云就叫做GTS。

之后阿里的中間件團隊基于TXC和GTS做出了開源的Seata,其中AT(Automatic Transaction)模式就是GTS原創(chuàng)的方案。

至于現在的版本,可以大致認為他們就是一樣的就行了,到2020年,GTS已經全面兼容了Seata的 GA 版本。

圖片來自阿里云官網GTS

整個GTS或者Seata包含以下幾個核心組件:

  • Transaction Coordinator(TC):事務協(xié)調器,維護全局事務的運行狀態(tài),負責協(xié)調并驅動全局事務的提交或回滾。
  • Transaction Manager(TM):控制全局事務的邊界,負責開啟一個全局事務,并最終發(fā)起全局提交或全局回滾的決議。
  • Resource Manager(RM):控制分支事務,負責分支注冊、狀態(tài)匯報,并接收事務協(xié)調器的指令,驅動分支(本地)事務的提交和回滾。

無論對于TCC還是原創(chuàng)的AT模式的支持,整個分布式事務的原理其實相對來說還是比較容易理解。

  1. 事務開啟時,TM向TC注冊全局事務,并且獲得全局事務XID
  2. 這時候多個微服務的接口發(fā)生調用,XID就會傳播到各個微服務中,每個微服務執(zhí)行事務也會向TC注冊分支事務。
  3. 之后TM就可以管理針對每個XID的事務全局提交和回滾,RM完成分支的提交或者回滾。
核心組件定義-圖片來自阿里云官網

AT模式

原創(chuàng)的AT模式相比起TCC的方案來說,無需自己實現多個接口,通過代理數據源的形式生成更新前后的UNDO_LOG,依靠UNDO_LOG來實現回滾的操作。

執(zhí)行的流程如下:

  1. TM向TC注冊全局事務,獲得XID
  2. RM則會去代理JDBC數據源,生成鏡像的SQL,形成UNDO_LOG,然后向TC注冊分支事務,把數據更新和UNDO_LOG在本地事務中一起提交
  3. TC如果收到commit請求,則會異步去刪除對應分支的UNDO_LOG,如果是rollback,就去查詢對應分支的UNDO_LOG,通過UNDO_LOG來執(zhí)行回滾
事務模式-AT-圖片來自阿里云官網

TCC模式

相比AT模式代理JDBC數據源生成UNDO_LOG來生成逆向SQL回滾的方式,TCC就更簡單一點了。

  1. TM向TC注冊全局事務,獲得XID
  2. RM向TC注冊分支事務,然后執(zhí)行Try方法,同時上報Try方法執(zhí)行情況
  3. 然后如果收到TC的commit請求就執(zhí)行Confirm方法,收到rollback則執(zhí)行Cancel
事務模式-TCC-圖片來自阿里云官網

XA模式

  1. TM向TC注冊全局事務,獲得XID
  2. RM向TC注冊分支事務,XA Start,執(zhí)行SQL,XA END,XA Prepare,然后上報分支執(zhí)行情況
  3. 然后如果收到TC的commit請求就執(zhí)行Confirm方法,收到rollback則執(zhí)行Cancel
事務模式-XA-圖片來自阿里云官網

SAGA模式

  1. TM向TC注冊全局事務,獲得XID
  2. RM向TC注冊分支事務,然后執(zhí)行業(yè)務方法,并且上報分支執(zhí)行情況
  3. RM收到分支回滾,執(zhí)行對應的業(yè)務回滾方法
事務模式-Saga-圖片來自阿里云官網

總結

這里從事務的ACID開始,向大家先說了XA是分布式事務處理的規(guī)范,之后談到2PC和3PC,2PC有同步阻塞、單點故障和數據不一致的問題,3PC在一定程度上解決了同步阻塞和單點故障的問題,但是還是沒有完全解決數據不一致的問題。

之后說到TCC、SAGA、消息隊列的最終一致性的方案,TCC由于實現過于麻煩和復雜,業(yè)務很少應用,SAGA了解即可,國內也很少有應用到的,消息隊列提供了解耦的實現方式,對于中小公司來說可能是較為低成本的實現方式。

最后再說目前國內的實現框架,云端阿里云的GTS兼容Seata,非云端使用Seata,它提供了XA、TCC、AT、SAGA的解決方案,可以說是目前的主流選擇。


免責聲明:本文內容由21ic獲得授權后發(fā)布,版權歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉