當(dāng)前位置:首頁(yè) > 公眾號(hào)精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]來(lái)自:z小趙 前言 經(jīng)過(guò)上篇文章的簡(jiǎn)單實(shí)戰(zhàn)之后,今天來(lái)聊聊生產(chǎn)者將消息從客戶端發(fā)送到 Broker 上背后發(fā)生了哪些故事,看不看由你,但是我保證可以本篇文章你一定可以學(xué)到應(yīng)用背后的一些實(shí)質(zhì)東西。 本文我們從以下 4 個(gè)方面來(lái)探討下一條消息如何被準(zhǔn)確的發(fā)送


Kafka一條消息如何被存儲(chǔ)到Broker上?

來(lái)自:z小趙

前言

經(jīng)過(guò)上篇文章的簡(jiǎn)單實(shí)戰(zhàn)之后,今天來(lái)聊聊生產(chǎn)者將消息從客戶端發(fā)送到 Broker 上背后發(fā)生了哪些故事,看不看由你,但是我保證可以本篇文章你一定可以學(xué)到應(yīng)用背后的一些實(shí)質(zhì)東西。

本文我們從以下 4 個(gè)方面來(lái)探討下一條消息如何被準(zhǔn)確的發(fā)送到 Broker 的 partition 上。

1. 客戶端組件

2. 客戶端緩存存儲(chǔ)模型

3. 確定消息的 partition 位置

4. 發(fā)送線程的工作原理


客戶端組件

  • KafkaProducer:

KafkaProducer 是一個(gè)生產(chǎn)者客戶端的進(jìn)程,通過(guò)該對(duì)象啟動(dòng)生產(chǎn)者來(lái)發(fā)送消息。

  • RecordAccumulator:

RecordAccumulator 是一個(gè)記錄收集器,用于收集客戶端發(fā)送的消息,并將收集到的消息暫存到客戶端緩存中。

  • Sender:

Sender 是一個(gè)發(fā)送線程,負(fù)責(zé)讀取記錄收集器中緩存的批量消息,經(jīng)過(guò)一些中間轉(zhuǎn)換操作,將要發(fā)送的數(shù)據(jù)準(zhǔn)備好,然后交由 Selector 進(jìn)行網(wǎng)絡(luò)傳輸。

  • Selector:

Selector 是一個(gè)選擇器,用于處理網(wǎng)絡(luò)連接和讀寫(xiě)處理,使用網(wǎng)絡(luò)連接處理客戶端上的網(wǎng)絡(luò)請(qǐng)求。

通過(guò)使用以上四大組件即可完成客戶端消息的發(fā)送工作。消息在網(wǎng)絡(luò)中傳輸?shù)姆绞街荒芡ㄟ^(guò)二級(jí)制的方式,所以首先需要將消息序列化為二進(jìn)制形式緩存在客戶端,kafka 使用了雙端隊(duì)列的方式將消息緩存起來(lái),然后使用發(fā)送線程(Sender)讀取隊(duì)列中的消息交給 Selector 進(jìn)行網(wǎng)絡(luò)傳輸發(fā)送給服務(wù)端(Broker)

Kafka一條消息如何被存儲(chǔ)到Broker上?
主流程

以上為發(fā)送消息的主流程,附上部分源碼供大家參考,接下來(lái)分析下幾個(gè)非常重要流程的具體實(shí)現(xiàn)原理。


客戶端緩存存儲(chǔ)模型

Kafka一條消息如何被存儲(chǔ)到Broker上?
客戶端緩存模型

從上圖可以看出,一條消息首先需要確定要被存儲(chǔ)到那個(gè) partition 對(duì)應(yīng)的雙端隊(duì)列上;其次,存儲(chǔ)消息的雙端隊(duì)列是以批的維度存儲(chǔ)的,即 N 條消息組成一批,一批消息最多存儲(chǔ) N 條,超過(guò)后則新建一個(gè)組來(lái)存儲(chǔ)新消息;其次,新來(lái)的消息總是從左側(cè)寫(xiě)入,即越靠左側(cè)的消息產(chǎn)生的時(shí)間越晚;最后,只有當(dāng)一批消息湊夠 N 條后才會(huì)發(fā)送給 Broker,否則不會(huì)發(fā)送到 Broker 上。

了解了客戶端存儲(chǔ)模型后,來(lái)探討下確定消息的 partition(分區(qū))位置?


確定消息的 partition 位置

消息可分為兩種,一種是指定了 key 的消息,一種是沒(méi)有指定 key 的消息。

對(duì)于指定了 key 的消息,partition 位置的計(jì)算方式為:Utils.murmur2(key) % numPartitions,即先對(duì) key 進(jìn)行哈希計(jì)算,然后在于 partition 個(gè)數(shù)求余,從而得到該條消息應(yīng)該被存儲(chǔ)在哪個(gè) partition 上。

對(duì)于沒(méi)有指定 key 的消息,partition 位置的計(jì)算方式為:采用 round-robin 方式確定 partition 位置,即采用輪詢的方式,平均的將消息分布到不同的 partition 上,從而避免某些 partition 數(shù)據(jù)量過(guò)大影響 Broker 和消費(fèi)端性能。

注意

由于 partition 有主副的區(qū)分,此處參與計(jì)算的 partition 數(shù)量是當(dāng)前有主 partition 的數(shù)量,即如果某個(gè) partition 無(wú)主的時(shí)候,則此 partition 是不能夠進(jìn)行數(shù)據(jù)寫(xiě)入的。

稍微解釋一下,主副 partition 的機(jī)制是為了提高 kafka 系統(tǒng)的容錯(cuò)性的,即當(dāng)某個(gè) Broker 意外宕機(jī)時(shí),在此 Broker 上的主 partition 狀態(tài)為不可讀寫(xiě)時(shí)(只有主 partition 可對(duì)外提供讀寫(xiě)服務(wù),副 partition 只有數(shù)據(jù)備份的功能),kafka 會(huì)從主 partition 對(duì)應(yīng)的 N 個(gè)副 partition 中挑選一個(gè),并將其狀態(tài)改為主 partition,從而繼續(xù)對(duì)外提供讀寫(xiě)操作。

消息被確定分配到某個(gè) partition 對(duì)應(yīng)記錄收集器(即雙端隊(duì)列)后,接下來(lái),發(fā)送線程(Sender)從記錄收集器中收集滿足條件的批數(shù)據(jù)發(fā)送給 Broker,那么發(fā)送線程是如何收集滿足條件的批數(shù)據(jù)的?批數(shù)據(jù)是按照 partition 維度發(fā)送的還是按照 Broker 維度發(fā)送數(shù)據(jù)的?


發(fā)送線程的工作原理

Sender 線程的主要工作是收集滿足條件的批數(shù)據(jù),何為滿足條件的批數(shù)據(jù)?緩存數(shù)據(jù)是以批維度存儲(chǔ)的,當(dāng)一批數(shù)據(jù)量達(dá)到指定的 N 條時(shí),就滿足發(fā)送給 Broker 的條件了。

partition 維度和 Broker 維度發(fā)送消息模型對(duì)比。

Kafka一條消息如何被存儲(chǔ)到Broker上?
模型對(duì)比圖

從圖中可以看出,左側(cè)按照 partition 維度發(fā)送消息,每個(gè) partition 都需要和 Broker 建連,總共發(fā)生了四次網(wǎng)絡(luò)連接。而右側(cè)將分布在同一個(gè) Broker 的 partition 按組聚合后在與 Broker 建連,只需要兩次網(wǎng)絡(luò)連接即可。所以 Kafka 選擇右側(cè)的方式。

Sender 的主要工作

第一步:掃描記錄收集器中滿足條件的批數(shù)據(jù),然后將 partition -> 批數(shù)據(jù)映射轉(zhuǎn)換成 BrokerId -> N 批數(shù)據(jù)的映射。第二步:Sender 線程會(huì)為每個(gè) BrokerId 創(chuàng)建一個(gè)客戶端請(qǐng)求,然后將請(qǐng)求交給 NetWorkClient,由 NetWrokClient 去真正發(fā)送網(wǎng)絡(luò)請(qǐng)求到 Broker。

NetWorkClient 的工作內(nèi)容

Sender 線程準(zhǔn)備好要發(fā)送的數(shù)據(jù)后,交由 NetWorkClient 來(lái)進(jìn)行網(wǎng)絡(luò)相關(guān)操作。主要包括客戶端與服務(wù)端的建連、發(fā)送客戶端請(qǐng)求、接受服務(wù)端響應(yīng)。完成如上一系列的工作主要由如下方法完成。

  1. reday()方法。從記錄收集器獲取準(zhǔn)備完畢的節(jié)點(diǎn),并連接所有準(zhǔn)備好的節(jié)點(diǎn)。
  2. send()方法。為每個(gè)節(jié)點(diǎn)創(chuàng)建一個(gè)客戶端請(qǐng)求,然后將請(qǐng)求暫時(shí)存到節(jié)點(diǎn)對(duì)應(yīng)的 Channel(通道)中。
  3. poll()方法。該方法會(huì)真正輪詢網(wǎng)絡(luò)請(qǐng)求,發(fā)送請(qǐng)求給服務(wù)端節(jié)點(diǎn)和接受服務(wù)端的響應(yīng)。

總結(jié)

以上,即為生產(chǎn)者客戶端的一條消息從生產(chǎn)到發(fā)送到 Broker 上的全過(guò)程?,F(xiàn)在是不是就很清晰了呢?也許有些朋友會(huì)比較疑惑它的網(wǎng)絡(luò)請(qǐng)求模型是什么樣的,作者就猜你會(huì)你會(huì)問(wèn),下一篇我們就來(lái)扒開(kāi)它的神秘面紗看看其究竟是怎么實(shí)現(xiàn)的,敬請(qǐng)期待。

特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒(méi)關(guān)注的小伙伴,可以長(zhǎng)按關(guān)注一下:

Kafka一條消息如何被存儲(chǔ)到Broker上?

長(zhǎng)按訂閱更多精彩▼

Kafka一條消息如何被存儲(chǔ)到Broker上?

如有收獲,點(diǎn)個(gè)在看,誠(chéng)摯感謝

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉