什么是 “分布式事務” ？

時間：2021-01-26 20:51:40

關鍵字：分布式事務

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]對于分布式事務，相信所有人都應該很了解，為什么會有分布式事務？

對于分布式事務，相信所有人都應該很了解，為什么會有分布式事務？無論是數據量導致的分庫，還是現在微服務盛行的場景都是他出現的原因。

這一篇內容還是避免不了俗套，主要的范圍無非是XA、2PC、3PC、TCC，再最后到Seata。

但是，我認為這東西，只是適用于面試和理論的了解，你真要說這些方案實際生產中有人用嗎？

有，但是會實現的更簡單，不會套用理論來實現，大廠有大廠的解決方案，中小公司用框架或者壓根就不存在分布式事務的問題。

那，為什么還要寫這個？

為了你面試八股文啊，小可愛。

事務

要說分布式事務，首先還是從事務的基本特征說起。

A原子性：在事務的執(zhí)行過程中，要么全部執(zhí)行成功，要么都不成功。

C一致性：事務在執(zhí)行前后，不能破壞數據的完整性。一致性更多的說的是通過AID來達到目的，數據應該符合預先的定義和約束，由應用層面來保證，還有的說法是C是強行為了ACID湊出來的。

I隔離性：多個事務之間是互相隔離的，事務之間不能互相干擾，涉及到不同事務的隔離級別的問題。

D持久性：一旦事務提交，數據庫中數據的狀態(tài)就應該是永久性的。

XA

XA（eXtended Architecture）是指由X/Open 組織提出的分布式事務處理的規(guī)范，他是一個規(guī)范或者說是協(xié)議，定義了事務管理器TM(Transaction Manager)，資源管理器RM(Resource Manager)，和應用程序。

事務管理器TM就是事務的協(xié)調者，資源管理器RM可以認為就是一個數據庫。

2PC

XA定義了規(guī)范，那么2PC和3PC就是他的具體實現方式。

2PC叫做二階段提交，分為投票階段和執(zhí)行階段兩個階段。

投票階段

TM向所有的參與者發(fā)送prepare請求，詢問是否可以執(zhí)行事務，等待各個參與者的響應。

這個階段可以認為只是執(zhí)行了事務的SQL語句，但是還沒有提交。

如果都執(zhí)行成功了就返回YES，否則返回NO。

執(zhí)行階段

執(zhí)行階段就是真正的事務提交的階段，但是要考慮到失敗的情況。

如果所有的參與者都返回YES，那么就執(zhí)行發(fā)送commit命令，參與者收到之后執(zhí)行提交事務。

反之，只要有任意一個參與者返回的是NO的話，就發(fā)送rollback命令，然后執(zhí)行回滾的操作。

2PC的缺陷

同步阻塞，可以看到，在執(zhí)行事務的過程當中，所有數據庫的資源都被鎖定，如果這時候有其他人來訪問這些資源，將會被阻塞，這是一個很大的性能問題。
TM單點問題，只要一個TM，一旦TM宕機，那么整個流程無法繼續(xù)完成。
數據不一致，如果在執(zhí)行階段，參與者腦裂或者其他故障導致沒有收到commit請求，部分提交事務，部分未提交，那么數據不一致的問題就產生了。

3PC

既然2PC有這么多問題，所以就衍生出了3PC的概念，也叫做三階段提交，他把整個流程分成了CanCommit、PreCommit、DoCommit三個步驟，相比2PC，增加的就是CanCommit階段。

CanCommit

這個階段就是先詢問數據庫是否執(zhí)行事務，發(fā)送一個canCommit的請求去詢問，如果可以的話就返回YES，反之返回NO。

PreCommit

這個階段就等同于2PC的投票階段了，發(fā)送preCommit命令，然后去執(zhí)行SQL事務，成功就返回YES，反之返回NO。

但是，這個地方的區(qū)別在于參與者有了超時機制，如果參與者超時未收到doCommit命令的話，將會默認去提交事務。

DoCommit

DoCommit階段對應到2PC的執(zhí)行階段，如果上一個階段都是收到YES的話，那么就發(fā)送doCommit命令去提交事務，反之則會發(fā)送abort命令去中斷事務的執(zhí)行。

相比2PC的改進

對于2PC的同步阻塞的問題，我們可以看到因為3PC加入了參與者的超時機制，所以原來2PC的如果某個參與者故障導致的同步阻塞的問題時間縮短了，這是一個優(yōu)化，但是并沒有完全避免。

第二個單點故障的問題，同樣因為超時機制的引入，一定程度上也算是優(yōu)化了。

但是數據不一致的問題，這個始終沒有得到解決。

舉個栗子：

在PreCommit階段，某個參與者發(fā)生腦裂，無法收到TM的請求，這時候其他參與者執(zhí)行abort事務回滾，而腦裂的參與者超時之后繼續(xù)提交事務，還是有可能發(fā)生數據不一致的問題。

那么，為什么要加入DoCommit這個階段呢？就是為了引入超時機制，事先我們先確認數據庫是否都可以執(zhí)行事務，如果都OK，那么才會進入后面的步驟，所以既然都可以執(zhí)行，那么超時之后說明發(fā)生了問題，就自動提交事務。

TCC

TCC的模式叫做Try、Confirm、Cancel，實際上也就是2PC的一個變種而已。

實現這個模式，一個事務的接口需要拆分成3個，也就是Try預占、Confirm確認提交、最后Cancel回滾。

對于TCC來說，實際生產我基本上就沒看見過有人用，考慮到原因，首先是程序員的本身素質參差不齊，多個團隊協(xié)作你很難去約束別人按照你的規(guī)則來實現，另外一點就是太過于復雜。

如果說有簡單的應用的話，庫存的應用或許可以算做是一個。

一般庫存的操作，很多實現方案里面都會會在下單的時候先預占庫存，下單成功之后再實際去扣減庫存，最終如果發(fā)生了異常再回退。

凍結、預占庫存就是2PC的準備階段，真正下單成功去扣減庫存就是2PC的提交階段，回滾就是某個發(fā)生異常的回滾操作，只不過在應用層面來實現了2PC的機制而已。

SAGA

Saga源于1987 年普林斯頓大學的 Hecto 和 Kenneth 發(fā)表的如何處理 long lived transaction（長活事務）論文。

主要思想就是將長事務拆分成多個本地短事務。

如果全部執(zhí)行成功，就正常完成了，反之，則會按照相反的順序依次調用補償。

SAGA模式有兩種恢復策略：

向前恢復，這個模式偏向于一定要成功的場景，失敗則會進行重試
向后恢復，也就是發(fā)生異常的子事務依次回滾補償

由于這個模式在國內基本沒看見有誰用的，不在贅述。

消息隊列

基于消息隊列來實現最終一致性的方案，這個相比前面的我個人認為還稍微靠譜一點，那些都是理論啊，正常生產的實現很少看見應用。

基于消息隊列的可能真正在應用的還稍微多一點。

一般來說有兩種方式，基于本地消息表和依賴MQ本身的事務消息。

本地消息表的這個方案其實更復雜，實際上我也沒看到過真正誰來用。這里我以RocketMQ的事務消息來舉例，這個方式相比本地消息表則更完全依賴MQ本身的特性做了解耦，釋放了業(yè)務開發(fā)的復雜工作量。

業(yè)務發(fā)起方，調用遠程接口，向MQ發(fā)送一條半事務消息，MQ收到消息之后會返回給生產者一個ACK
生產者收到ACK之后，去執(zhí)行事務，但是事務還沒有提交。
生產者會根據事務的執(zhí)行結果來決定發(fā)送commit提交或者rollback回滾到MQ
這一點是發(fā)生異常的情況，比如生產者宕機或者其他異常導致MQ長時間沒有收到commit或者rollback的消息，這時候MQ會發(fā)起狀態(tài)回查。
MQ如果收到的是commit的話就會去投遞消息，消費者正常消費消息即可。如果是rollback的話，則會在設置的固定時間期限內去刪除消息。

這個方案基于MQ來保證消息事務的最終一致性，還算是一個比較合理的解決方案，只要保證MQ的可靠性就可以正常實施應用，業(yè)務消費方根據本身的消息重試達到最終一致性。

框架

以上說的都是理論和自己實現的方式，那么分布式事務就沒有框架來解決我們的問題嗎？

有，其實還不少，但是沒有能扛旗者出現，要說有，阿里的開源框架Seata還有阿里云的GTS。

GTS（Global Transaction Service 全局事務服務）是阿里云的中間件產品，只要你用阿里云，付錢就可以用GTS。

Seata（Simple Extensible Autonomous Transaction Architecture）則是開源的分布式事務框架，提供了對TCC、XA、Saga以及AT模式的支持。

那么，GTS和Seata有什么關系呢？

實際上最開始的時候他們都是基于阿里內部的TXC（Taobao Transaction Constructor）分布式中間件產品，然后TXC經過改造上了阿里云就叫做GTS。

之后阿里的中間件團隊基于TXC和GTS做出了開源的Seata，其中AT（Automatic Transaction）模式就是GTS原創(chuàng)的方案。

至于現在的版本，可以大致認為他們就是一樣的就行了，到2020年，GTS已經全面兼容了Seata的 GA 版本。

圖片來自阿里云官網GTS

整個GTS或者Seata包含以下幾個核心組件：

Transaction Coordinator（TC）：事務協(xié)調器，維護全局事務的運行狀態(tài)，負責協(xié)調并驅動全局事務的提交或回滾。
Transaction Manager（TM）：控制全局事務的邊界，負責開啟一個全局事務，并最終發(fā)起全局提交或全局回滾的決議。
Resource Manager（RM）：控制分支事務，負責分支注冊、狀態(tài)匯報，并接收事務協(xié)調器的指令，驅動分支（本地）事務的提交和回滾。

無論對于TCC還是原創(chuàng)的AT模式的支持，整個分布式事務的原理其實相對來說還是比較容易理解。

事務開啟時，TM向TC注冊全局事務，并且獲得全局事務XID
這時候多個微服務的接口發(fā)生調用，XID就會傳播到各個微服務中，每個微服務執(zhí)行事務也會向TC注冊分支事務。
之后TM就可以管理針對每個XID的事務全局提交和回滾，RM完成分支的提交或者回滾。

核心組件定義-圖片來自阿里云官網

AT模式

原創(chuàng)的AT模式相比起TCC的方案來說，無需自己實現多個接口，通過代理數據源的形式生成更新前后的UNDO_LOG，依靠UNDO_LOG來實現回滾的操作。

執(zhí)行的流程如下：

TM向TC注冊全局事務，獲得XID
RM則會去代理JDBC數據源，生成鏡像的SQL，形成UNDO_LOG，然后向TC注冊分支事務，把數據更新和UNDO_LOG在本地事務中一起提交
TC如果收到commit請求，則會異步去刪除對應分支的UNDO_LOG，如果是rollback，就去查詢對應分支的UNDO_LOG，通過UNDO_LOG來執(zhí)行回滾

事務模式-AT-圖片來自阿里云官網

TCC模式

相比AT模式代理JDBC數據源生成UNDO_LOG來生成逆向SQL回滾的方式，TCC就更簡單一點了。

TM向TC注冊全局事務，獲得XID
RM向TC注冊分支事務，然后執(zhí)行Try方法，同時上報Try方法執(zhí)行情況
然后如果收到TC的commit請求就執(zhí)行Confirm方法，收到rollback則執(zhí)行Cancel

事務模式-TCC-圖片來自阿里云官網

XA模式

TM向TC注冊全局事務，獲得XID
RM向TC注冊分支事務，XA Start，執(zhí)行SQL，XA END，XA Prepare，然后上報分支執(zhí)行情況
然后如果收到TC的commit請求就執(zhí)行Confirm方法，收到rollback則執(zhí)行Cancel

事務模式-XA-圖片來自阿里云官網

SAGA模式

TM向TC注冊全局事務，獲得XID
RM向TC注冊分支事務，然后執(zhí)行業(yè)務方法，并且上報分支執(zhí)行情況
RM收到分支回滾，執(zhí)行對應的業(yè)務回滾方法

事務模式-Saga-圖片來自阿里云官網

總結

這里從事務的ACID開始，向大家先說了XA是分布式事務處理的規(guī)范，之后談到2PC和3PC，2PC有同步阻塞、單點故障和數據不一致的問題，3PC在一定程度上解決了同步阻塞和單點故障的問題，但是還是沒有完全解決數據不一致的問題。

之后說到TCC、SAGA、消息隊列的最終一致性的方案，TCC由于實現過于麻煩和復雜，業(yè)務很少應用，SAGA了解即可，國內也很少有應用到的，消息隊列提供了解耦的實現方式，對于中小公司來說可能是較為低成本的實現方式。

最后再說目前國內的實現框架，云端阿里云的GTS兼容Seata，非云端使用Seata，它提供了XA、TCC、AT、SAGA的解決方案，可以說是目前的主流選擇。

免責聲明：本文內容由21ic獲得授權后發(fā)布，版權歸原作者所有，本平臺僅提供信息存儲服務。文章僅代表作者個人觀點，不代表本平臺立場，如有問題，請聯(lián)系我們，謝謝！

什么是 “分布式事務” ？

事務

XA

2PC

3PC

TCC

SAGA

消息隊列

框架

總結

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

人工智能驅動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

從容應對未知風險----解密亞馬遜云科技的韌性之道

中國游戲市場開始復蘇！騰訊、網易等巨頭縮減在日本投資

獨立自主！華為董事：致力打造不依賴西方的技術

華為張平安：數字世界話語權最終由生態(tài)繁榮決定！

中國通信服務公布2024年中期業(yè)績

NVI技術創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產業(yè)鏈高速發(fā)展

軟通動力與長三角投資達成戰(zhàn)略合作共謀數字生態(tài)新發(fā)展

海南區(qū)6家凱悅系酒店與嵐圖達成戰(zhàn)略合作，共同推動新能源出行體驗

安嵐攜手妮可?巴菲特開啟療愈之旅在秋日紅葉的浪漫中療愈身心

不懼美國封鎖！華為：我們給大家提供系統(tǒng)、存儲等

尼爾森IQ深耕中國四十載，共繪未來新篇章

第二十二屆跨盈年度B2B營銷高管峰會2025聚焦"營銷競取，打破市場內卷實現認知進化"

恒久動力馳騁天地美孚1號攜手周冠宇邀您縱擎馳騁，勁享駕趣體驗

美通社母公司Cision發(fā)布CisionOne平臺，進軍亞太地區(qū)媒體監(jiān)測市場

移遠通信推出大模型解決方案，重塑千行百業(yè)智能邊界

高途公布2024年第二季度未經審計業(yè)績

華為發(fā)布AI百校計劃：培養(yǎng)AI人才每年獲最高100萬支持

什么是 “分布式事務” ？

事務

XA

2PC

3PC

TCC

SAGA

消息隊列

框架

總結

什么是 “分布式事務” ？