深入探討《Small RTOS51中消息隊(duì)列的一處隱患》
摘要:Small RTOS51是一款重要的小型實(shí)時(shí)內(nèi)核,消息隊(duì)列是其提供的重要任務(wù)間通信的機(jī)制。針對(duì)其消息隊(duì)列實(shí)現(xiàn)代碼中的缺陷以及可能導(dǎo)致的消息丟失這一嚴(yán)重問(wèn)題,從操作系統(tǒng)等待與喚醒機(jī)制理論的角度出發(fā),剖析Small RTOS51內(nèi)核在消息隊(duì)列甚至互斥型信號(hào)量等實(shí)現(xiàn)機(jī)制上的漏洞所在;進(jìn)一步指出原內(nèi)核實(shí)現(xiàn)方式的修改方法,以及《Small RTOS51中消息隊(duì)列的一處隱患》作者提出的第2種修改方法的完美實(shí)現(xiàn)。
關(guān)鍵詞:Small RTOS51 消息隊(duì)列 喚醒模型 隱患分析
引言
貴刊2005年第7期《Small RTOS51中消息隊(duì)列的一處隱患》一文,對(duì)Small RTOS51V1.12.1版本的消息隊(duì)列機(jī)制進(jìn)行了周密的分析,不但找出了問(wèn)題所在,也提出了相應(yīng)的兩種解決方法[1]。實(shí)時(shí)嵌入式系統(tǒng)對(duì)于安全性有很高的要求,作為實(shí)時(shí)嵌入式系統(tǒng)的內(nèi)核,不但要求精簡(jiǎn)高效,更要加強(qiáng)安全,防止因操作系統(tǒng)出錯(cuò)而在應(yīng)用領(lǐng)域?qū)е聻?zāi)難性的后果。因此原文作者所做的工作極有價(jià)值,同時(shí)也感謝貴刊對(duì)這一領(lǐng)域的高度重視。
因?yàn)檫@一問(wèn)題涉及到內(nèi)核的等待與喚醒機(jī)制,并且正是由于對(duì)內(nèi)核的等待與喚醒機(jī)制的理解與運(yùn)用不同,才導(dǎo)致了問(wèn)題的出現(xiàn),所以本文從操作系統(tǒng)理論的高度以及目前主流的實(shí)時(shí)內(nèi)核的實(shí)現(xiàn)方法兩方面入手論述這一問(wèn)題,并揭示如何才能完美實(shí)現(xiàn)原文的第2種方法。
1 內(nèi)核喚醒機(jī)制的三種模型
當(dāng)利用系統(tǒng)調(diào)用接口獲取資源時(shí),如果資源不滿足,系統(tǒng)調(diào)用可以返回錯(cuò)誤,也可以根據(jù)選項(xiàng)懸掛等待;當(dāng)有任務(wù)釋放資源從而資源可以滿足時(shí),就要將資源等待隊(duì)列中的相關(guān)任務(wù)喚醒。喚醒模型有三種[2]:
第1種,將該資源等待隊(duì)列中的任務(wù)全部喚醒,讓這些任務(wù)與系統(tǒng)中的其他任務(wù)平等竟?fàn)庂Y源。這種策略會(huì)使系統(tǒng)在一段時(shí)間內(nèi)繁忙,因?yàn)樽罱K只有一個(gè)任務(wù)獲取到資源,其他任務(wù)可能將經(jīng)歷一個(gè)從就緒態(tài)到運(yùn)行態(tài)再到阻塞態(tài)的過(guò)程。這種現(xiàn)象在操作系統(tǒng)理論上稱為“千軍萬(wàn)馬奔騰”。就目前的一些主流實(shí)時(shí)內(nèi)核VxWorks、Nucleus、uC/OS?II等來(lái)講,都沒(méi)有采用這種策略。
第2種,將該資源等待隊(duì)列中的一個(gè)任務(wù)喚醒,依據(jù)所采用的策略不同,可以是等待任務(wù)中優(yōu)先級(jí)最高的,也可以是第1個(gè)進(jìn)入等待隊(duì)列中的任務(wù)。這個(gè)任務(wù)被喚醒后將和系統(tǒng)中的其他任務(wù)一起競(jìng)爭(zhēng)這個(gè)資源。如果這個(gè)任務(wù)最終沒(méi)有競(jìng)爭(zhēng)到這個(gè)資源,它將再次進(jìn)入該資源的等待隊(duì)列并進(jìn)行任務(wù)調(diào)度。
第3種,將該資源等待隊(duì)列中的一個(gè)任務(wù)喚醒,依據(jù)所采用的策略不同,可以是等待任務(wù)中優(yōu)先級(jí)最高的,也可以是第1個(gè)進(jìn)入等待隊(duì)列中的任務(wù),這點(diǎn)和第2種方法是一樣的。和第2種情況不同的是,這個(gè)任務(wù)被指定為資源的獲得者。主流實(shí)時(shí)內(nèi)核VxWorks、Nucleus、uC/OS?II等都采用這種策略。以VxWorks為例,其內(nèi)核文檔指出[3]:“任務(wù)或ISR調(diào)用msgQSend()向消息隊(duì)列發(fā)送消息。此時(shí)如果沒(méi)有任務(wù)在等待該隊(duì)列中的消息,那么該消息進(jìn)入消息隊(duì)列的緩沖;如果有任務(wù)等待該隊(duì)列的消息,那么這個(gè)消息立即提交給第1個(gè)等待的任務(wù)?!边@段話有兩方面的含義:① 明確指出第1個(gè)等待的任務(wù)獲得資源;② 第1個(gè)等待的任務(wù)獲得資源的方式是直接從消息的發(fā)送者那里獲得,也就是說(shuō)這個(gè)消息將不進(jìn)入消息隊(duì)列進(jìn)行緩沖,消息在發(fā)送者和接收者之間進(jìn)行手把手的傳遞。對(duì)于這種機(jī)制的實(shí)現(xiàn),可以以著名的源代碼公開(kāi)的實(shí)時(shí)嵌入式操作系統(tǒng)Nucleus為例。下面是Nucleus內(nèi)核關(guān)于接收消息的一段精彩的代碼:
else {
/* 消息隊(duì)列為空,決定是否懸掛等待*/
if (suspend) {
/* 增加等待該消息隊(duì)列的任務(wù)數(shù)量 */
queue -> qu_tasks_waiting++;
/* 填充懸掛塊數(shù)據(jù)結(jié)構(gòu)并且懸掛該任務(wù)*/
suspend_ptr =&suspend_block;
suspend_ptr -> qu_queue=queue;
suspend_ptr -> qu_suspend_link.cs_next=NU_NULL;
suspend_ptr -> qu_suspend_link.cs_previous=NU_NULL;
suspend_ptr -> qu_message_area=
(UNSIGNED_PTR) message;
suspend_ptr -> qu_message_size=size;
task=(TC_TCB *) TCT_Current_Thread();
suspend_ptr -> qu_suspended_task=task;
/* 判斷該消息隊(duì)列的等待方式是先進(jìn)先出還是按任務(wù)
的優(yōu)先級(jí) */
if (queue -> qu_fifo_suspend) {
/* 是先進(jìn)先出等待方式,將懸掛塊鏈入消息隊(duì)列
的等待鏈表 */
CSC_Place_On_List((CS_NODE **)
&(queue -> qu_suspension_list),
&(suspend_ptr -> qu_suspend_link));
}
else {
/* 按優(yōu)先級(jí)方式將懸掛塊鏈入任務(wù)等待鏈表的
合適位置 */
suspend_ptr -> qu_suspend_link.cs_priority =
TCC_Task_Priority(task);
CSC_Priority_Place_On_List((CS_NODE **)
&(queue -> qu_suspension_list),
&(suspend_ptr -> qu_suspend_link));
}
/* 懸掛調(diào)用任務(wù),并自動(dòng)取消該消息隊(duì)列的臨界區(qū)
保護(hù) */
TCC_Suspend_Task((NU_TASK *) task,
NU_QUEUE_SUSPEND,
QUC_Cleanup, suspend_ptr, suspend);
/* 獲取該系統(tǒng)調(diào)用要求的返回狀態(tài)以及返回值*/
status =suspend_ptr -> qu_return_status;
*actual_size =suspend_ptr -> qu_actual_size;
}
else
/* 在消息隊(duì)列為空以及不等待的方式下,返回狀態(tài)
指示消息隊(duì)列為空*/
status =NU_QUEUE_EMPTY;
}
這段代碼是處理消息隊(duì)列中沒(méi)有消息時(shí)的情況的,并且在不進(jìn)行懸掛等待時(shí)返回碼是NU_QUEUE_EMPTY,提示隊(duì)列為空。我們注意到在選擇懸掛等待的情況下,填充了suspend_ptr指針?biāo)傅囊粋€(gè)懸掛塊結(jié)構(gòu),suspend_ptr -> qu_message_area填充的是接收任務(wù)指定的接收緩沖區(qū)指針,suspend_ptr -> qu_message_size填充的是接收任務(wù)指定的接收消息長(zhǎng)度。接下來(lái)依據(jù)不同的等待策略(任務(wù)優(yōu)先級(jí)或FIFO),將填充好的消息隊(duì)列懸掛塊鏈入該消息隊(duì)列的懸掛等待鏈表中,進(jìn)行任務(wù)調(diào)度。正是有了這個(gè)消息隊(duì)列懸掛塊數(shù)據(jù)結(jié)構(gòu),將來(lái)發(fā)送消息的任務(wù)依據(jù)這個(gè)懸掛塊中指定的接收消息緩沖區(qū)指針,把消息從發(fā)送任務(wù)直接復(fù)制到接收任務(wù)。當(dāng)接收消息的任務(wù)被喚醒并獲得執(zhí)行權(quán)后,只是簡(jiǎn)單地依據(jù)懸掛塊中的相關(guān)域的內(nèi)容返回系統(tǒng)調(diào)用而已。從上述分析可以看出,懸掛塊數(shù)據(jù)結(jié)構(gòu)起著重要的作用,它不僅標(biāo)明了是哪個(gè)任務(wù)在等待,也標(biāo)明了等待任務(wù)的一些詳細(xì)信息,同時(shí)也有結(jié)果狀態(tài)域。通過(guò)對(duì)Nucleus內(nèi)核定時(shí)器機(jī)制的分析得知,在任務(wù)等待資源超時(shí)的情況下,懸掛等待塊的結(jié)果狀態(tài)域?qū)⒈惶畛銷U_TIMEOUT。
2 針對(duì)Small RTOS51消息隊(duì)列的分析
有了上述三種模型的分析,很容易看出Small RTOS51V1.12.1版消息隊(duì)列所采用的是第2種模型,只是在實(shí)現(xiàn)時(shí)出現(xiàn)重大遺漏,被喚醒的任務(wù)沒(méi)有競(jìng)爭(zhēng)到資源時(shí)應(yīng)重新進(jìn)入等待表,而其內(nèi)核代碼卻沒(méi)有體現(xiàn)到這一點(diǎn)。這一點(diǎn)《Small RTOS51中消息隊(duì)列的一處隱患》的作者已經(jīng)分析得很清楚,其提出的第1種解決方案也很正確。重點(diǎn)是第2種解決方案。第2種解決方案屬于第3種模型,但其實(shí)現(xiàn)技術(shù)欠佳。正如原文作者所指出的那樣,第2種方案具有其自身不可調(diào)和的矛盾:“在發(fā)送消息的OSQIntPost()函數(shù)中,如果檢測(cè)到有任務(wù)正在等待此消息,則并不把消息數(shù)(buf[0])加1”,但這個(gè)消息畢竟進(jìn)入消息隊(duì)列了,這就造成了一種矛盾狀態(tài),消息數(shù)與消息隊(duì)列中的實(shí)際消息不相符。為了實(shí)現(xiàn)第3種模型的效果,即被喚醒的等待任務(wù)獲取資源,在消息數(shù)為0的情況下,原文作者通過(guò)進(jìn)一步判斷該任務(wù)是否還處在消息隊(duì)列的等待任務(wù)表中,來(lái)決定該任務(wù)是否從消息隊(duì)列中獲取消息;但消息數(shù)為0而消息隊(duì)列中還有消息卻為發(fā)送消息帶來(lái)隱患。要想解決這一矛盾,OSQIntPost()在喚醒等待任務(wù)的同時(shí)就應(yīng)該將該消息傳遞給這個(gè)任務(wù),這樣消息數(shù)仍然為0才不留隱患。uC/OS?II實(shí)現(xiàn)這一策略的技術(shù)是任務(wù)被喚醒后檢查任務(wù)控制塊中的OSTCBCur->OSTCBMsg這一數(shù)據(jù)域[4,5],獲取到的消息指針在此。注意,OSQPost()在有等待任務(wù)的情況下,如下處理:
if (pevent->OSEventGrp != 0x00) { /* 判斷是否有任務(wù)懸掛在消息隊(duì)列的等待表中 */28OS_EventTaskRdy(pevent, msg,OS_STAT_Q); /*將等待表中最高優(yōu)先級(jí)任務(wù)喚醒*/
OS_EXIT_CRITICAL();
OS_Sched(); /* 進(jìn)行任務(wù)調(diào)度,運(yùn)行最高優(yōu)先級(jí)任務(wù)*/
return (OS_NO_ERR);
}
即消息指針沒(méi)有進(jìn)消息隊(duì)列并且消息指針通過(guò)OS_EventTaskRdy(pevent, msg, OS_STAT_Q)傳給被喚醒的任務(wù)。這一作法符合第3種模型。
由此可見(jiàn),Small RTOS51V1.12.1要想實(shí)現(xiàn)第3種模型,其內(nèi)核的數(shù)據(jù)結(jié)構(gòu)需要有一些變化,像原文第2種方案那樣修改代碼,是不能最終解決問(wèn)題的。同Nucleus相比,實(shí)現(xiàn)消息隊(duì)列時(shí),uC/OS?II雖然沒(méi)有引入懸掛等待塊的概念,但其通過(guò)在任務(wù)控制塊中引入相應(yīng)數(shù)據(jù)項(xiàng)來(lái)最終實(shí)現(xiàn)第3種模型,并且結(jié)果是在任務(wù)被喚醒后進(jìn)行判斷的。
3 結(jié)論
雖然各種各樣的實(shí)時(shí)嵌入式操作系統(tǒng)千差萬(wàn)別,但從操作系統(tǒng)理論的角度分析,很容易將它們納入到某一具體的模型;實(shí)現(xiàn)細(xì)節(jié)有很大的不同,但其實(shí)現(xiàn)的功能應(yīng)符合通用原理。在操作系統(tǒng)理論的指導(dǎo)下,結(jié)合具體的實(shí)例源代碼分析、理解和應(yīng)用,才能有更大的把握。
參考文獻(xiàn)
1 陳皓. Small RTOS51中消息隊(duì)列的一處隱患. 單片機(jī)與嵌入式系統(tǒng)應(yīng)用,2005(7)
2 Jim Mauro,Richard McDougall.Solaris內(nèi)核結(jié)構(gòu).北京:機(jī)械工業(yè)出版社,2001
3 孔祥營(yíng),等. 嵌入式實(shí)時(shí)操作系統(tǒng)VxWorks及其開(kāi)發(fā)環(huán)境Tornado. 北京:中國(guó)電力出版社,2001
4 Labrosse Jean J.uC/OS?II——源碼公開(kāi)的實(shí)時(shí)嵌入式操作系統(tǒng).北京:中國(guó)電力出版社,2001
5 Labrosse Jean J.嵌入式實(shí)時(shí)操作系統(tǒng)uC/OS?II.北京:北京航空航天大學(xué)出版社,2003
韓明峰:碩士,主要研究方向?yàn)閷?shí)時(shí)嵌入式系統(tǒng)。