基于Linux 軟中斷機(jī)制以及tasklet、工作隊(duì)列機(jī)制分析
軟中斷分析最近工作繁忙,沒(méi)有時(shí)間總結(jié)內(nèi)核相關(guān)的一些東西。上次更新博客到了linux內(nèi)核中斷子系統(tǒng)。這次總結(jié)一下軟中斷,也就是softirq。之后還會(huì)總結(jié)一些tasklet、工作隊(duì)列機(jī)制。
1.為什么要軟中斷
編寫(xiě)驅(qū)動(dòng)的時(shí)候,一個(gè)中斷產(chǎn)生之后,內(nèi)核在中斷處理函數(shù)中可能需要完成很多工作。但是中斷處理函數(shù)的處理是關(guān)閉了中斷的。也就是說(shuō)在響應(yīng)中斷時(shí),系統(tǒng)不能再次響應(yīng)外部的其它中斷。這樣的后果會(huì)造成有可能丟失外部中斷。于是,linux內(nèi)核設(shè)計(jì)出了一種架構(gòu),中斷函數(shù)需要處理的任務(wù)分為兩部分,一部分在中斷處理函數(shù)中執(zhí)行,這時(shí)系統(tǒng)關(guān)閉中斷。另外一部分在軟件中斷中執(zhí)行,這個(gè)時(shí)候開(kāi)啟中斷,系統(tǒng)可以響應(yīng)外部中斷。
關(guān)于軟件中斷的理論各種書(shū)籍都有介紹,不多敘述。而要真正體會(huì)軟件中斷的作用就必須從代碼的角度來(lái)分析。我們做工作時(shí)候講求的是professional,當(dāng)一個(gè)人在某個(gè)領(lǐng)域一無(wú)所知的時(shí)候,我們稱(chēng)他為小白,偶,非蘋(píng)果電腦。小白的腦子里充滿(mǎn)了各種問(wèn)題。慢慢的當(dāng)這些疑惑解釋完之后,小白就脫白了。此時(shí),我們對(duì)這個(gè)領(lǐng)域的基本框架有了解,但這和professional還有一定的差距。再加以時(shí)日,逐漸融會(huì)貫通該領(lǐng)域才能達(dá)到專(zhuān)業(yè)的境界。
2. 什么時(shí)候觸發(fā)處理軟件中斷
說(shuō)了這么多廢話(huà),趕快步入正題。初識(shí)軟中斷,腦子里肯定有不少的疑問(wèn),首先就是軟件中斷在什么地方被觸發(fā)處理?這個(gè)問(wèn)題的答案就是:一個(gè)硬件中斷處理完成之后。下面的函數(shù)在處理完硬件中斷之后推出中斷處理函數(shù),在irq_exit中會(huì)觸發(fā)軟件中斷的處理。
這里要注意,invoke_softirq必須滿(mǎn)足兩個(gè)條件才能被調(diào)用到,一個(gè)就是不是在硬件中斷處理過(guò)程中或者在軟件中斷處理中,第二個(gè)就是必須有軟件中斷處于pending狀態(tài)。第二個(gè)好理解,有軟件中斷產(chǎn)生才去處理,沒(méi)有就不處理。第一個(gè)就不好理解了。
在linux系統(tǒng)的進(jìn)程數(shù)據(jù)結(jié)構(gòu)里,有這么一個(gè)數(shù)據(jù)結(jié)構(gòu)
#define preempt_count()(current_thread_info()->preempt_count),
利用preempt_count可以表示是否處于中斷處理或者軟件中斷處理過(guò)程中。
preempt_count的8~23位記錄中斷處理和軟件中斷處理過(guò)程的計(jì)數(shù)。如果有計(jì)數(shù),表示系統(tǒng)在硬件中斷或者軟件中斷處理過(guò)程中。系統(tǒng)這么設(shè)計(jì)是為了避免軟件中斷在中斷嵌套中被調(diào)用,并且達(dá)到在單個(gè)CPU上軟件中斷不能被重入的目的。對(duì)于ARM架構(gòu)的CPU不存在中斷嵌套中調(diào)用軟件中斷的問(wèn)題,因?yàn)锳RM架構(gòu)的CPU在處理硬件中斷的過(guò)程中是關(guān)閉掉中斷的。只有在進(jìn)入了軟中斷處理過(guò)程中之后才會(huì)開(kāi)啟硬件中斷,如果在軟件中斷處理過(guò)程中有硬件中斷嵌套,也不會(huì)再次調(diào)用軟中斷,because硬件中斷是軟件中斷處理過(guò)程中再次進(jìn)入的,此時(shí)preempt_count已經(jīng)記錄了軟件中斷!對(duì)于其它架構(gòu)的CPU,有可能在觸發(fā)調(diào)用軟件中斷前,也就是還在處理硬件中斷的時(shí)候,就已經(jīng)開(kāi)啟了硬件中斷,可能會(huì)發(fā)生中斷嵌套,在中斷嵌套中是不允許調(diào)用軟件中斷處理的。Why?我的理解是,在發(fā)生中斷嵌套的時(shí)候,表明這個(gè)時(shí)候是系統(tǒng)突發(fā)繁忙的時(shí)候,內(nèi)核第一要?jiǎng)?wù)就是趕緊把中斷中的事情處理完成,退出中斷嵌套。避免多次嵌套,哪里有時(shí)間處理軟件中斷,所以把軟件中斷推遲到了所有中斷處理完成的時(shí)候才能觸發(fā)軟件中斷。
3. 軟件中斷的處理過(guò)程
之前我已經(jīng)說(shuō)到,軟中斷的一個(gè)很大的目的就是避免中斷處理中,處理的操作過(guò)多而丟失中斷。同時(shí)中斷還需要考慮到一件事情就是中斷處理過(guò)程過(guò)長(zhǎng)就會(huì)影響系統(tǒng)響應(yīng)時(shí)間。如果一個(gè)中斷處理一秒鐘,那你一定能感受到串口卡住的現(xiàn)象。從另外一方面說(shuō)呢,我們又必須考慮中斷處理的操作一定的優(yōu)先度,畢竟是硬件觸發(fā)的事務(wù),關(guān)系到網(wǎng)絡(luò)、塊設(shè)備的效率問(wèn)題。Linux內(nèi)核就中斷方面就必須考慮平衡這三個(gè)方面的問(wèn)題。而下面我要分析的__do_softirq函數(shù)就恰似在這三者之間打太極,游刃有余,面面俱到!
__do_softirq函數(shù)處理軟件中斷過(guò)程如下圖流程分析
4. 首先調(diào)用local_softirq_pending函數(shù)取得目前有哪些位存在軟件中斷
5. 調(diào)用__local_bh_disable關(guān)閉軟中斷,其實(shí)就是設(shè)置正在處理軟件中斷標(biāo)記,在同一個(gè)CPU上使得不能重入__do_softirq函數(shù)
6. 重新設(shè)置軟中斷標(biāo)記為0,set_softirq_pending重新設(shè)置軟中斷標(biāo)記為0,這樣在之后重新開(kāi)啟中斷之后硬件中斷中又可以設(shè)置軟件中斷位。
7. 開(kāi)啟硬件中斷
8. 之后在一個(gè)循環(huán)中,遍歷pending標(biāo)志的每一位,如果這一位設(shè)置就會(huì)調(diào)用軟件中斷的處理函數(shù)。在這個(gè)過(guò)程中硬件中斷是開(kāi)啟的,隨時(shí)可以打斷軟件中斷。這樣保證硬件中斷不會(huì)丟失。
9. 之后關(guān)閉硬件中斷,查看是否又有軟件中斷處于pending狀態(tài),如果是,并且在本次調(diào)用__do_softirq函數(shù)過(guò)程中沒(méi)有累計(jì)重復(fù)進(jìn)入軟件中斷處理的次數(shù)超過(guò)10次,就可以重新調(diào)用軟件中斷處理。如果超過(guò)了10次,就調(diào)用wakeup_softirqd();喚醒內(nèi)核的一個(gè)進(jìn)程來(lái)處理軟件中斷。設(shè)立10次的限制,也是為了避免影響系統(tǒng)響應(yīng)時(shí)間。[!--empirenews.page--]
4. 處理軟中斷內(nèi)核線(xiàn)程
之前我說(shuō)到不能讓CPU長(zhǎng)時(shí)間來(lái)處理中斷事務(wù),這樣會(huì)影響系統(tǒng)的響應(yīng)時(shí)間,嚴(yán)重影響用戶(hù)和系統(tǒng)之間的交互式體驗(yàn)。所以在之前的__do_softirq中最多將循環(huán)執(zhí)行10次,那么當(dāng)執(zhí)行了10次仍然有軟中斷在pending狀態(tài),這個(gè)時(shí)候應(yīng)該怎么處理呢?系統(tǒng)將喚醒一個(gè)軟件中斷處理的內(nèi)核進(jìn)程,在內(nèi)核進(jìn)程中處理pending中的軟件中斷。這里要注意,之前我們分析的觸發(fā)軟件中斷的位置其實(shí)是中斷上下文中,而在軟中斷的內(nèi)核線(xiàn)程中實(shí)際已經(jīng)是進(jìn)程的上下文。
這里說(shuō)的軟中斷上下文指的就是系統(tǒng)為每個(gè)CPU建立的ksoftirqd進(jìn)程。
看完這個(gè)函數(shù),我不得不佩服這個(gè)函數(shù)設(shè)計(jì)的精巧!而我更多的從中體會(huì)到其中蘊(yùn)藏的一種做人的道理。那就是做人要霸道一點(diǎn),太謙和太恭維不行,但是又不能橫行霸道,原則的問(wèn)題要公平講理,一定的時(shí)候顧及別人的利益,好處不能一個(gè)人獨(dú)吞。這就跟下面ksoftirqd處理過(guò)程一樣,該狠的時(shí)候禁止搶占,其它進(jìn)程別想調(diào)度到哦,但是自己占用CPU時(shí)間過(guò)長(zhǎng)的話(huà),也自覺(jué)的問(wèn)一問(wèn)是不是該釋放CPU給其它進(jìn)程了。
下面我們就來(lái)分析一下這個(gè)處理過(guò)程怎么就體現(xiàn)了上面的這種說(shuō)法呢?軟中斷的內(nèi)核進(jìn)程中主要有兩個(gè)大循環(huán),外層的循環(huán)處理有軟件中斷就處理,沒(méi)有軟件中斷就休眠。內(nèi)層的循環(huán)處理軟件中斷,并每循環(huán)一次都試探一次是否過(guò)長(zhǎng)時(shí)間占據(jù)了CPU,需要調(diào)度釋放CPU給其它進(jìn)程。具體的操作在注釋中做了解釋。