當(dāng)前位置:首頁 > 公眾號精選 > IOT物聯(lián)網(wǎng)小鎮(zhèn)
[導(dǎo)讀]作?者:道哥,10年嵌入式開發(fā)老兵,專注于:C/C、嵌入式、Linux。關(guān)注下方公眾號,回復(fù)【書籍】,獲取Linux、嵌入式領(lǐng)域經(jīng)典書籍;回復(fù)【PDF】,獲取所有原創(chuàng)文章(PDF格式)。目錄單片機(jī)中常用的環(huán)形緩沖區(qū)多線程異步日志:雙緩沖機(jī)制雙緩沖機(jī)制為什么高效盡可能的降低Lock...



目錄
  • 單片機(jī)中常用的環(huán)形緩沖區(qū)


  • 多線程異步日志:雙緩沖機(jī)制


  • 雙緩沖機(jī)制為什么高效


  • 盡可能的降低 Lock 的時(shí)間


  • 參考代碼


  • 可以繼續(xù)優(yōu)化的地方



別人的經(jīng)驗(yàn),我們的階梯!


大家好,我是道哥,今天我為大伙兒解說的技術(shù)知識點(diǎn)是:【在多線程環(huán)境下,如何實(shí)現(xiàn)一個(gè)高效的日志系統(tǒng)】。


在很久之前,曾經(jīng)寫過一篇文章《【最佳實(shí)踐】生產(chǎn)者和消費(fèi)者模式中的雙緩沖技術(shù)》,討論了:在一個(gè)產(chǎn)品級的日志系統(tǒng)中,如何利用雙緩沖機(jī)制來解決生產(chǎn)者-消費(fèi)者相關(guān)的問題。


前段時(shí)間,有位小伙伴私信給我,希望可以具體聊一下這個(gè)實(shí)現(xiàn)方案。


本來答應(yīng)在國慶期間完成的,但是我的拖延癥一犯再犯,一直拖到今天,終于把這個(gè)作業(yè)給補(bǔ)上了。


雙緩沖這個(gè)思路并不是我原創(chuàng)的,而是參考了大神陳碩老師的一本書《Linux 多線程服務(wù)端編程》。


從書名就可以看出,討論的是服務(wù)器端的相關(guān)編程內(nèi)容,而且是多線程場景下的,因此可以隱約看出,書中給出的參考代碼的質(zhì)量是很高的。


如果您的主力開發(fā)語言是 C ,強(qiáng)烈推薦您去研究下這本書。


很多 C 語言的細(xì)節(jié)問題,作者都給出了自己專業(yè)、嚴(yán)謹(jǐn)?shù)乃伎己徒鉀Q方案。


言歸正傳!


在上一篇文章中,我主要從思路、概念的角度,來描述如何利用雙緩沖機(jī)制。


這篇文章,我們就忠于書中原文,一起來學(xué)習(xí)一下作者的思考過程,并給出一些對性能起決定作用的關(guān)鍵代碼。


先來看一下書中的性能測試結(jié)果:


多線程異步【日志系統(tǒng)】,高效、強(qiáng)悍的實(shí)現(xiàn)方式:雙緩沖!

單片機(jī)中常用的環(huán)形緩沖區(qū)

一說到緩沖區(qū),相信各位小伙伴一定看過很多關(guān)于緩沖緩沖區(qū)的文章和代碼,在單片機(jī)中的使用率很高。


多線程異步【日志系統(tǒng)】,高效、強(qiáng)悍的實(shí)現(xiàn)方式:雙緩沖!所謂的環(huán)形緩沖區(qū),就是一塊平整的內(nèi)存區(qū)域,讓它的尾部連接到首部即可。


另一個(gè)類似的結(jié)構(gòu):環(huán)形隊(duì)列,本質(zhì)上都是一樣的。


維護(hù)環(huán)形緩沖區(qū)的數(shù)據(jù)結(jié)構(gòu)中,有head和tail指針。


當(dāng)寫入的時(shí)候,把輸入寫入到tail指針的位置,寫完之后,遞增tail的指針值;


當(dāng)讀取的時(shí)候,從head指針的位置開始讀取,讀完之后,也遞增head的指針值。


這樣的操作方式,比較適合那種簡單的單輸入、單輸出場景。


只要處理好:當(dāng) head 和 tail 這兩個(gè)指針交匯的時(shí)候如何處理即可。


但是在x86的操作系統(tǒng)中,在多核 多線程的工作環(huán)境下,無論是從功能上、還是從性能上來考慮,這樣的環(huán)形緩沖區(qū)就滿足不了需求了。


還是拿日志系統(tǒng)來舉例:在一個(gè)應(yīng)用程序中,可能會(huì)有多個(gè)線程同時(shí)調(diào)用日志系統(tǒng)的寫入API接口函數(shù),這就需要保證線程安全。


這樣的線程稱作 前臺/前端 線程。


日志數(shù)據(jù)存儲(chǔ)在內(nèi)存中之后,最終是要輸出的,比如:寫入到文件系統(tǒng)、通過網(wǎng)絡(luò)上傳到服務(wù)端、輸出到其他的監(jiān)控系統(tǒng)等等。


實(shí)現(xiàn)輸出操作的也是一個(gè)線程,假如需要寫入到文件系統(tǒng),那么在寫入期間,這個(gè)線程就需要一直持有緩沖區(qū)中的日志數(shù)據(jù)。


這樣的線程稱作 后臺/后端 線程。


但是,文件系統(tǒng)的寫入速度是很慢的(畢竟要操作硬盤啊),如果這個(gè)時(shí)候又有前臺線程需要寫日志信息了,該如何處理?


總不能暴力的說:后臺線程正在把現(xiàn)有的日志數(shù)據(jù)存儲(chǔ)到硬盤上,已經(jīng)持有了內(nèi)存緩沖區(qū),前臺線程你是后來的,先等著!


多線程異步日志:雙緩沖機(jī)制

在這本書中,作者對這樣的日志系統(tǒng)規(guī)定了幾個(gè)關(guān)鍵的要求,都是與實(shí)際的業(yè)務(wù)需求相關(guān)的:


  1. 線程安全:多個(gè)線程可以并發(fā)寫日志,不造成競爭,兩個(gè)線程的日志信息不會(huì)交叉出現(xiàn);


  2. 吞吐量大;


  3. 日志消息有多種級別,格式可配置等等;


為了達(dá)到這個(gè)目的,作者提出了“雙緩沖”思路(Double Buffering)。


基本思路是:


準(zhǔn)備兩塊 buffer: A 和 B;


前端負(fù)責(zé)往 buffer A 填數(shù)據(jù)(日志信息);


后端負(fù)責(zé)把 buffer B 的數(shù)據(jù)寫入文件。


當(dāng) buffer A 寫滿之后,交換 A 和 B,讓后端將 buffer A 的數(shù)據(jù)寫入文件,而前端則往 buffer B 填入新的日志信息,如此反復(fù)。


其實(shí)還是蠻好理解的哈,我們還是來畫圖描述一下:


多線程異步【日志系統(tǒng)】,高效、強(qiáng)悍的實(shí)現(xiàn)方式:雙緩沖!當(dāng) buffer A 寫滿之后,交換兩個(gè)緩沖區(qū):


多線程異步【日志系統(tǒng)】,高效、強(qiáng)悍的實(shí)現(xiàn)方式:雙緩沖!

雙緩沖機(jī)制為什么高效

使用兩個(gè)buffer緩沖區(qū)的好處是:


大部分的時(shí)間中,前臺線程和后臺線程不會(huì)操作同一個(gè)緩沖區(qū),這也就意味著前臺線程的操作,不需要等待后臺線程緩慢的寫文件操作(因?yàn)椴恍枰i定臨界區(qū))。


還有一點(diǎn)就是:后臺線程把緩沖區(qū)中的日志信息,寫入到文件系統(tǒng)中的頻率,完全由自己的寫入策略來決定,避免了每條新日志信息都觸發(fā)(喚醒)后端日志線程。


例如:可以根據(jù)實(shí)際使用場景,定義一個(gè)刷新頻率,例如:3秒。


只要刷新時(shí)間到了,即使緩沖區(qū)中的日志信息很少,也要把它們存儲(chǔ)到文件系統(tǒng)中。


換言之,前端線程不是將一條條日志信息分別傳送給后端線程,而是將多條信息拼成一個(gè)大的 buffer 傳送給后端,相當(dāng)于是批量處理,減少了線程喚醒的頻率,降低開銷。


盡可能的降低 Lock 的時(shí)間

在剛才的描述中,有這么一句話:在[大部分的時(shí)間中],前臺線程和后臺線程不會(huì)操作同一個(gè)緩沖區(qū)。


也就是是說,在小部分時(shí)間內(nèi),它們還是有可能操作同一個(gè)緩沖區(qū)的。


那就是:當(dāng)前臺的寫入緩沖區(qū) buffer A 被寫滿了,需要與 buffer B 進(jìn)行交換的時(shí)候。


交換的操作,是由后臺線程來執(zhí)行的,具體流程是:


  1. 后臺線程被喚醒,此時(shí) buffer B 緩沖區(qū)是空的,因?yàn)樵谏弦淮芜M(jìn)入睡眠之前,buffer B 中數(shù)據(jù)已經(jīng)被寫入到文件系統(tǒng)中了;


  2. 把 buffer A 與 buffer B 進(jìn)行交換;


  3. 把 buffer B 中的數(shù)據(jù)寫入到文件系統(tǒng);


  4. 開始休眠;


在第2個(gè)步驟中:交換緩沖區(qū),就是把兩個(gè)指針變量的值交換一下而已,利用C語言中的swap操作,效率很高。


在執(zhí)行交換緩沖區(qū)的時(shí)候,可能會(huì)有前臺線程寫入日志,因此這個(gè)步驟需要在 Lock 的狀態(tài)下執(zhí)行。


可以看出:這個(gè)雙緩沖機(jī)制的前后臺日志系統(tǒng),需要鎖定的代碼僅僅是交換兩個(gè)緩沖區(qū)這個(gè)動(dòng)作,Lock 的時(shí)間是極其短暫的!這就是它提高吞吐量的關(guān)鍵所在!


參考代碼

在示例代碼中,作者對雙緩沖機(jī)制進(jìn)行了擴(kuò)展,采用4個(gè)緩沖區(qū),這樣可以進(jìn)一步減少或避免前端線程的等待時(shí)間。


數(shù)據(jù)結(jié)構(gòu)如下:


多線程異步【日志系統(tǒng)】,高效、強(qiáng)悍的實(shí)現(xiàn)方式:雙緩沖!這里的nextBuffer_相當(dāng)有是currentBuffer_的“備胎”。


當(dāng)前臺線程發(fā)現(xiàn)currentBuffer_不可用時(shí)(空間已滿,或者正在被后臺線程操作),可以立刻寫入到這個(gè)"備胎"緩沖區(qū)中,從而降低了前臺線程的等待時(shí)間


下面是前臺線程的寫入代碼:


多線程異步【日志系統(tǒng)】,高效、強(qiáng)悍的實(shí)現(xiàn)方式:雙緩沖!前端線程在生成一條日志消息的時(shí)候,會(huì)調(diào)用append()函數(shù)。


在這個(gè)函數(shù)中,如果當(dāng)前緩沖區(qū)(currentBuffer_)剩余的空間足夠大,直接把消息消息拷貝(追加)進(jìn)去,這是最常見的情況。


如果當(dāng)前緩沖區(qū)的剩余空間,小于這次日志信息的寫入長度,就把它移動(dòng)到 buffer_ 集合中(一個(gè)Vector),此時(shí)會(huì)發(fā)送喚醒信號給后端線程,然后把nextBuffer_這個(gè)備胎 move 為currentBuffer_。


move 是 C 中的操作,意思是移動(dòng),而不是拷貝/復(fù)制。


當(dāng)然了,如果前端的寫入速度太快,一下子就把兩塊緩沖區(qū)都用完了,那么只好分配一塊新的 buffer 作為當(dāng)前緩沖區(qū),這是極少發(fā)生的情況。


再來看看后端的代碼實(shí)現(xiàn),這里只貼出了最關(guān)鍵的臨界區(qū)內(nèi)的代碼,也就是前文所說的“小部分時(shí)間”的情況:


多線程異步【日志系統(tǒng)】,高效、強(qiáng)悍的實(shí)現(xiàn)方式:雙緩沖!這段代碼中最重要的就是 swap 函數(shù),它把前后臺使用的緩沖區(qū)進(jìn)行了交換。


當(dāng)前后臺緩沖區(qū)交換之后,就離開了臨界區(qū),此時(shí)后臺線程就可以慢慢的往文件系統(tǒng)中寫入數(shù)據(jù)了。


另外,這段代碼中還有一個(gè)地方比較有意思,就是對備胎nextBuffer_的操作:


當(dāng)前臺中使用的備胎nextBuffer_已經(jīng)被消耗掉時(shí),后臺線程及時(shí)地為它補(bǔ)充一個(gè)新的備胎。


可以繼續(xù)優(yōu)化的地方

在本章的最后部分,作者提出了一個(gè)更加嚴(yán)苛的情況:


異步日志系統(tǒng)中,使用了一個(gè)全局鎖,盡管臨界區(qū)很小,但是如果線程數(shù)目較多,鎖爭用也可能影響性能。


一種解決方法是像 Java 的 ConCurrentHashMap 那樣使用多個(gè)桶子(bucket),前端線程寫日志的時(shí)候根據(jù)線程id哈希到不同的 bucket 中,以減少競爭。


這種解決方案本質(zhì)上就是提供更多的緩沖區(qū),并且把不同的緩沖區(qū)分配給不同的線程(根據(jù)線程 id 的哈希值)。


那些哈希到相同緩沖區(qū)的線程,同樣是存在爭用的情況的,只不過爭用的概率被降低了很多



------ End ------
本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉