Vxworks下的高速緩沖存儲器一致性問題
1. Vxworks下的高速緩沖存儲器一致性問題
美國風(fēng)河(WindRiver)公司的VxWorks是目前最先進的實時嵌入式操作系統(tǒng)。Tornade是它的集成一體開發(fā)環(huán)境。然而,vxWorks下編程硬件驅(qū)動程序時卻存在著高速緩沖存儲器一致性(Cache Coherence)的問題。該系統(tǒng)下有兩個cache區(qū):數(shù)據(jù)高速緩沖存儲器和指令高速緩沖存儲器 本文討論的高速緩沖存儲器問題均指數(shù)據(jù)高速緩沖存儲器。
高速緩沖存儲器一致性問題是指高速緩沖存儲器中的數(shù)據(jù)必須與內(nèi)存中的數(shù)據(jù)保持同步(一致) 這個問題常發(fā)生在CPU內(nèi)核與另一個設(shè)備異步訪問內(nèi)存時。
高速緩沖存儲器可以工作在Write-through或copyback模式。在Write-through模式下,數(shù)據(jù)輸出時.系統(tǒng)會把數(shù)據(jù)同時寫入高速緩沖存儲器和內(nèi)存中.這樣.就保證了輸出時的高速緩沖存儲器一致性。但該模式卻無法解決輸入時的高速緩沖存儲器一致性問題.在Copyback模式下。系統(tǒng)只寫數(shù)據(jù)到高速緩沖存儲器中,因此對于數(shù)據(jù)輸入和輸出都存在高速緩沖存儲器一致性問題。
VxWorks下通常有兩種方法解決高速緩沖存儲器一致性問題.
(1)Cache-safe buffer(即non-cacheable 的buffer)。這種情況下,CPU讀數(shù)據(jù)時會從內(nèi)存中讀取.而不是從高速緩沖存儲器中讀?。憾鳦PU寫數(shù)據(jù)時則同時寫入高速緩沖存儲器和內(nèi)存.
該方案可通過以下兩種方法實現(xiàn).
* 在內(nèi)存段屬性中定義此段buffer,空間屬性為non-cacheable;
* 在內(nèi)存管理單元MMU支持下,用cacheDmaMalloc()/cacheDmaFree()獲得此段buffer。則此段buffer是non-cacheable的(注意無MMU時。分配的buffer是cacheable.此法不支持這種情況)。
(2)對于cacheable的buffer空間,采用flush()/invalidate()函數(shù)或宏來配合讀/寫使用此段buffer空間.flush()將高速緩沖存儲器中的數(shù)據(jù)寫入內(nèi)存。invalidate()則將內(nèi)存中數(shù)據(jù)寫入高速緩沖存儲器。這兩個函數(shù)都保證了高速緩沖存儲器與內(nèi)存同步。
實際flush()/invalidate()函數(shù)有如下兩組,功能相同稍有區(qū)別:
組1:CACHE_DMA_FLUSH()函數(shù)和CACHE_DMA_INVALIDATE()函數(shù)
組2:cacheFlush()函數(shù)和cacheInvalidate()函數(shù)
第一組實際是2個宏,與cacheDmaMalloc()函數(shù)配合使用。
2. MPC860上高速緩沖存儲器一致性的軟件設(shè)計方法
MPC860是摩托羅拉公司的32位多用途集成通信控制器.主要包括一個32位的嵌入式PowerPC core。一個通信處理模塊CPM,一個系統(tǒng)集成模塊SIM60及一個獨立的快速以太網(wǎng)FEC模塊.在VxWorks下編寫MPC860的驅(qū)動程序。要保護的是CPM、FEC模塊的發(fā)送/接收緩沖區(qū)描述符TXBD/RXBD及其對應(yīng)的緩沖區(qū)對于MPC860開發(fā)中象BD(Buffer DescriptiOn)這樣的靜態(tài)空間適合采用cache-safe boffer方法。即采用第1種方法;
而對BD域中對應(yīng)的緩沖區(qū).由于該緩沖區(qū)多是動態(tài)分配和釋放,更適合采用第2種方法,即采用flush()/invalidate()函數(shù)或宏來配合讀/寫使用此段緩沖區(qū)空間.這樣可以避免將整個的包括還未分配的空間都預(yù)先標記為non-cacheable而造成效率低下。具體可以采用下面的方法:
(1)TXBD/RXBD放在MPC860雙口RAM中。并在板級支持包BSP文件Syslib.c中的頁描述符數(shù)據(jù)結(jié)構(gòu) svsPhysMemDesc[]中定義860上所有64K內(nèi)存空間為non-cachable的緩沖區(qū)。從而不必做cache coherence的保護了.
(2)對應(yīng)TXBD/RXBD中數(shù)據(jù)指針域的發(fā)/收緩沖區(qū)均用cache DmaMalloc()獲得(具體是指初始化時給所有接收RXBD掛接的初始緩沖區(qū)和接收幀函數(shù)中給RXBD掛接的新緩沖區(qū).以及在應(yīng)用層中使用的發(fā)送 TXBD對應(yīng)的緩沖區(qū))。而用cacheDmaFree()釋放.同時發(fā)送幀函數(shù)中用cacheFlush()函數(shù)保護待發(fā)送TXBD對應(yīng)的緩沖區(qū):接收幀函數(shù)中用cache Invalidate()函數(shù)保護已經(jīng)裝載了接收數(shù)據(jù)的接收緩沖區(qū)。以快速以太網(wǎng)FEC的驅(qū)動程序為例,保護具體實現(xiàn)如下:
/* FEC發(fā)送幀函數(shù) */
FEC_SEND_FRAME()
{
/* 填寫發(fā)送buffer內(nèi)容,實際填寫在data cache中 */
sptr_tx_buffer[i]=data;
fec.txBd.dataPointer=(char*)sptr_tx_buffer;
/*將填寫在data cache中的內(nèi)容寫回內(nèi)存中的實際發(fā)送buffer(即以sptr_tx_buffer為地址的內(nèi)存)中*/
cacheFlush(DATA_CACHE,sptr_tx_buffer,1518);
/*啟動發(fā)送命令,F(xiàn)EC控制器發(fā)送內(nèi)存中buffer內(nèi)容而非data cache中內(nèi)容*/
*(UINT32*)VXImmrGet()+MOT_FEC_TX_ACT_OFF))=MOT_FEC_TX_ACT;
}
/*FEC接收幀函數(shù)*/
FEC_RECEIVE_FRAME()
{
/*取得實際接收buffer的地址*/
pBuffer=(void*)fec.rxBd.dataPointer;
/*將RXBD對應(yīng)的內(nèi)存中接收buffer中內(nèi)容寫回data cache中*/
cacheInvalidate(DATA_CACHE,pBuffer,1520);
*vptr_buffer=pBuffer;
/*以后CPU可以安全使用接收buffer中的內(nèi)容**vptr_buffer了*/
}
if ((pBuffer = (void *)malloc (allocBytes)) == NULL)
return (NULL);
/* Flush any data that may be still sitting in the cache */
cacheClear (DATA_CACHE, pBuffer, allocBytes);
cacheInvalidate (INSTRUCTION_CACHE, pBuffer, allocBytes);