基于PCI的單板計(jì)算機(jī)應(yīng)用中起到系統(tǒng)控制器作用的實(shí)現(xiàn)方法
掃描二維碼
隨時(shí)隨地手機(jī)看文章
最近出現(xiàn)了一些兼?zhèn)鋽?shù)字信號(hào)處理器(DSP)和微控制器(MCU)能力的處理器,從而為那些既要求典型的MCU功能又要求高性能信號(hào)處理功能的應(yīng)用大開(kāi)了方便之門(mén)。
這類(lèi)MCU的優(yōu)勢(shì)之一就是起到系統(tǒng)控制器的作用,通過(guò)以太網(wǎng)接口、USB接口和PCI等標(biāo)準(zhǔn)接口來(lái)協(xié)調(diào)各子系統(tǒng)的活動(dòng)。因?yàn)樵S多信號(hào)處理器都包含了這樣一些相同的接口,所以考慮一下系統(tǒng)的體系結(jié)構(gòu)正在如何演進(jìn)是很有意義的。本文將討論一種DSP在一個(gè)基于PCI的單板計(jì)算機(jī)應(yīng)用中起到系統(tǒng)控制器作用的實(shí)現(xiàn)方法。
原理圖
PCI總線的開(kāi)發(fā)是為了提供一種能輕松連接外圍設(shè)備和臺(tái)式計(jì)算機(jī)的高性能方法。這些外圍設(shè)備包括圖形子系統(tǒng)、磁盤(pán)控制器和I/O設(shè)備。PCI總線與CPU總線是分開(kāi)的,但是仍然需要訪問(wèn)主存儲(chǔ)器。該接口可以通過(guò)一個(gè)電橋連接至系統(tǒng)總線,該電橋允許它以獨(dú)立于CPU時(shí)鐘頻率的固定頻率運(yùn)行??偠灾?,PCI為關(guān)鍵的系統(tǒng)元件提供了一個(gè)高帶寬的通道,以便在彼此之間傳送數(shù)據(jù)。
隨著嵌入式計(jì)算的出現(xiàn),人們都希望以最低的成本設(shè)計(jì)出帶有通用外圍設(shè)備的不以PC為中心的計(jì)算平臺(tái)。由于PCI的性能、可擴(kuò)縮性和普遍性,使其成為一種自然的“通用標(biāo)準(zhǔn)”,用于連接大量已經(jīng)使用的外圍設(shè)備。
此外,通過(guò)標(biāo)準(zhǔn)接口將嵌入式處理器連接到比它們功能更強(qiáng)大的臺(tái)式機(jī)處理器是很有利的,其驅(qū)動(dòng)力是嵌入式應(yīng)用的發(fā)展,例如,用戶手持設(shè)備、銷(xiāo)售點(diǎn)終端以及連接PC的工業(yè)自動(dòng)化系統(tǒng)。PCI促進(jìn)了模塊嵌入式系統(tǒng)設(shè)計(jì),從而允許多種外圍設(shè)備能無(wú)縫地連接到一種通用總線。最后,這種方法降低了產(chǎn)品總材料成本并且增加了設(shè)計(jì)的重用,從而降低了開(kāi)發(fā)帶有嵌入式PCI接口的處理器的總風(fēng)險(xiǎn)。
系統(tǒng)結(jié)構(gòu)原理圖
系統(tǒng)體系結(jié)構(gòu)的演進(jìn)
在MCU控制的系統(tǒng)中,DSP一般是充當(dāng)協(xié)處理器。如圖1(a)所示,這種配置中的MCU和DSP通常是通過(guò)高速的串行鏈路或者存儲(chǔ)接口進(jìn)行通信。MCU先把數(shù)據(jù)傳遞給DSP,然后DSP把處理過(guò)的數(shù)據(jù)傳回給MCU,很可能還是通過(guò)同樣的接口。對(duì)諸如音頻處理這樣的中低帶寬應(yīng)用來(lái)說(shuō),這種方式效果很好。但是在處理高帶寬數(shù)據(jù)流時(shí),這種方式就就無(wú)法勝任了,例如,原始視頻流,很可能就要求超過(guò)25MB/s的數(shù)據(jù)傳送速率,遠(yuǎn)遠(yuǎn)超過(guò)了傳統(tǒng)的高速串行接口所能支持的8~15MB/s的速率。另外,如果MCU和DSP之間沒(méi)有可用的專用存儲(chǔ)接口,共享的存儲(chǔ)器會(huì)降低總體性能,因?yàn)镈SP在訪問(wèn)共享空間的同時(shí)也占用了MCU的外部存儲(chǔ)器總線。
上述不利因素的結(jié)合導(dǎo)致了如圖1(b)所示的排列。通過(guò)在DSP中集成PCI功能,該DSP可以簡(jiǎn)單地看作另一種置于由MCU主控的PCI總線另一端的“外圍設(shè)備”。在這里,DSP起到“PCI設(shè)備”的作用。該P(yáng)CI連接利用空閑的帶寬來(lái)支持視頻流速率,而且這種配置甚至允許該DSP作為一種“總線主控器”以便直接訪問(wèn)該P(yáng)CI總線上的其他設(shè)備(例如網(wǎng)絡(luò)和存儲(chǔ)接口)。
隨著系統(tǒng)成本壓力進(jìn)一步推動(dòng)了設(shè)計(jì)的集成,如圖1c所示的解決方案就更加理想。圖中的處理器不是一個(gè)簡(jiǎn)單的DSP,而是一種結(jié)合了強(qiáng)大的DSP和MCU功能的信號(hào)處理器。因此,它可以作為系統(tǒng)控制器,能主控PCI總線并且減少了一個(gè)處理器,從而大大節(jié)省了總系統(tǒng)成本。ADSP-BF533 Blackfin媒體處理器正是具備這種功能的器件。
PCI接口的特點(diǎn)
為了便于下一步的討論,先明確幾個(gè)與PCI有關(guān)的關(guān)鍵術(shù)語(yǔ)。
主機(jī)與設(shè)備,主控器與受控器
PCI的主要特點(diǎn)之一就是對(duì)等通信??紤]到大多數(shù)的設(shè)備都支持一種“主控器”操作,隨后設(shè)備就可以在彼此之間或者與系統(tǒng)主機(jī)(例如,圖1(a)所示的MCU或PC)之間通信。在這種拓?fù)浣Y(jié)構(gòu)中,所有的設(shè)備,包括主機(jī),都能作為一個(gè)特定PCI事務(wù)的主控器或者受控器。主機(jī)與設(shè)備的區(qū)別就在于主機(jī)可以在總線上配置各PCI代理并且提供總線仲裁。通過(guò)配置,各PCI代理(可以主控總線的設(shè)備)將彼此看成是一種存儲(chǔ)映像設(shè)備的集合,可以通過(guò)在它們各自的存儲(chǔ)器區(qū)域中發(fā)起數(shù)據(jù)傳送來(lái)訪問(wèn)這些設(shè)備。每個(gè)PCI代理都可以對(duì)目標(biāo)機(jī)(“受控器”)發(fā)起一次數(shù)據(jù)傳送,從而成為該特定事務(wù)的總線主控器。
總線仲裁
在一些嵌入式應(yīng)用中,當(dāng)前的總線主控器可以不止一個(gè),這時(shí)就需要一個(gè)PCI總線判決器。在嵌入式應(yīng)用中利用一個(gè)小型的可編程邏輯電路(PLD)很容易實(shí)現(xiàn)這種功能(以前都由PC提供)。每個(gè)可能的總線主控器都有兩條線(一條用于請(qǐng)求,一條用于授權(quán))進(jìn)入總線判決器。當(dāng)一個(gè)總線主控器要求使用PCI總線時(shí),必須在其設(shè)備請(qǐng)求線上申請(qǐng)。判決器來(lái)決定什么時(shí)候授予其總線使用權(quán)并在適當(dāng)?shù)臅r(shí)候通知其授權(quán)線。雖然PCI標(biāo)準(zhǔn)中沒(méi)有規(guī)定具體的仲裁算法,但是要求有“一種公平的算法以防止死鎖”。通常,可以采用一種簡(jiǎn)單的輪循方法來(lái)確保不會(huì)有某一個(gè)總線主控器獨(dú)占總線。
性能
如果數(shù)據(jù)吞吐量性能很重要,那么突發(fā)傳送是很關(guān)鍵的。PCI總線上的突發(fā)傳送主要是由同一地址段接連發(fā)生至少兩次數(shù)據(jù)傳送而引起的。和其他的傳送類(lèi)型一樣,一旦總線主控器接收到PCI總線的使用權(quán),就要傳送其起始地址和事務(wù)類(lèi)型。在實(shí)際的PCI系統(tǒng)中,總線主控器和目標(biāo)機(jī)必須都支持突發(fā)事務(wù)。例如,如果目標(biāo)機(jī)只支持單一事務(wù),性能就會(huì)極大降低,因?yàn)樵摽偩€主控器必須反復(fù)申請(qǐng)總線使用權(quán)并傳送每個(gè)事務(wù)的地址。當(dāng)總線主控器和目標(biāo)機(jī)都支持突發(fā)事務(wù)時(shí),該P(yáng)CI上的帶寬就能達(dá)到132MB/s(4B×33MHz)的最高吞吐量。
硬件結(jié)構(gòu)圖
直接存儲(chǔ)器存取(DMA)是提高接口中數(shù)據(jù)傳送帶寬的關(guān)鍵,因?yàn)樗趥魉蛿?shù)據(jù)時(shí)所需內(nèi)核處理器的干預(yù)最小。這種采集或傳送數(shù)據(jù)的設(shè)備可以利用其自帶的DMA控制器,自動(dòng)地從處理器來(lái)回傳送數(shù)據(jù)。DMA通過(guò)利用PCI的突發(fā)能力來(lái)存取接口中的大塊數(shù)據(jù),從而極大地提高了性能。這種能力推動(dòng)了諸如實(shí)時(shí)視頻處理等應(yīng)用的發(fā)展。
對(duì)多處理器系統(tǒng)的內(nèi)在支持
通過(guò)用PCI總線連接多個(gè)嵌入式處理器,就能實(shí)現(xiàn)一個(gè)多處理器系統(tǒng)。采用這種直接的連接方式很容易就能使計(jì)算能力成倍增加。有了附加的數(shù)據(jù)總線以及每個(gè)處理器訪問(wèn)存儲(chǔ)器的能力,就能處理數(shù)據(jù)流。采用這種方法,無(wú)須增加算法的編程復(fù)雜度就可以在每個(gè)處理器之間對(duì)數(shù)據(jù)進(jìn)行分區(qū)。另外,即使是在視頻吞吐速率,仍然有足夠的可用空間用于與控制有關(guān)的傳送開(kāi)銷(xiāo)。
從系統(tǒng)控制器的角度看PCI
PCI存儲(chǔ)器模式
PCI協(xié)議使用基地址寄存器(BAR)為各設(shè)備分配存儲(chǔ)器和I/O范圍。在配置期間,主機(jī)會(huì)詢問(wèn)各個(gè)設(shè)備以便決定每個(gè)設(shè)備所需資源。如果主機(jī)可以提供所有這些資源需求,它就會(huì)在每個(gè)設(shè)備的存儲(chǔ)器BAR和I/O BAR中寫(xiě)入相應(yīng)的起始地址。然后,通過(guò)對(duì)其存儲(chǔ)器或者I/O范圍內(nèi)發(fā)起一次傳送就可以訪問(wèn)每個(gè)設(shè)備了。此外,每個(gè)PCI代理都可以訪問(wèn)總線上的所有其他代理。
ADSP-BF533是一個(gè)PCI設(shè)備,它有BAR0(存儲(chǔ)器BAR)和BAR2(I/O BAR)兩個(gè)寄存器,以及相應(yīng)的屏蔽寄存器。這些屏蔽寄存器可用于指定每個(gè)區(qū)域所需要的存儲(chǔ)數(shù)量。
因?yàn)橹鳈C(jī)是在其PCI存儲(chǔ)器空間內(nèi)為設(shè)備分配一個(gè)地址,所以該設(shè)備(在這里就是指BF533)需要將此地址映射到它的內(nèi)部或者外部存儲(chǔ)器空間中。對(duì)BF533來(lái)說(shuō),存儲(chǔ)器空間包括芯片內(nèi)的L2存儲(chǔ)器以及外部的SDRAM和(或)異步存儲(chǔ)器,并且I/O空間會(huì)映射到處理器的存儲(chǔ)器映射寄存器(MMR)區(qū)域。在這些定義的引導(dǎo)下,一個(gè)內(nèi)部事務(wù)就會(huì)被控制在適當(dāng)?shù)膮^(qū)域。
當(dāng)ADSP-BF533作為給定事務(wù)的目標(biāo)機(jī)(受控器)時(shí)可以應(yīng)用上述討論的方法。當(dāng)它發(fā)起傳送時(shí),會(huì)在其PCI外部存儲(chǔ)器BAR或者I/O BAR中寫(xiě)入它希望訪問(wèn)的代理地址。無(wú)論是對(duì)PCI存儲(chǔ)器還是I/O空間的一次讀或?qū)懚紩?huì)發(fā)起一次以該P(yáng)CI代理的存儲(chǔ)器或者I/O區(qū)域?yàn)槟繕?biāo)的事務(wù)。
在主機(jī)模式中,外發(fā)事務(wù)的發(fā)生方式與上面的描述類(lèi)似。對(duì)內(nèi)送事務(wù)(ADSP-BF533作為受控器)的方案稍微有些區(qū)別。在主機(jī)模式中,BF533不使用BAR寄存器,而是使用主機(jī)存儲(chǔ)控制寄存器將其資源開(kāi)放給外部代理。它可以接受或者不接受對(duì)其存儲(chǔ)器和I/O空間的訪問(wèn)。在有些情況下,它還能指示那些開(kāi)放資源還有多少可以被外部PCI代理訪問(wèn)。這就為保護(hù)關(guān)鍵的代碼或者數(shù)據(jù)段免遭其他PCI代理的更改提供了一種機(jī)制。
在PCI存儲(chǔ)空間中開(kāi)窗口
一旦初始化完成后,每個(gè)PCI設(shè)備都有對(duì)主機(jī)或總線上其他PCI設(shè)備“開(kāi)放”的存儲(chǔ)資源。這些存儲(chǔ)資源可以包括內(nèi)部存儲(chǔ)器和外部存儲(chǔ)器。例如,在BF533中,內(nèi)部或者外部L2存儲(chǔ)器中的“窗口”可以被PCI總線上的任何其他設(shè)備共享。然后每個(gè)總線主控器就可以直接訪問(wèn)這些開(kāi)放的存儲(chǔ)器空間,就像是在訪問(wèn)它自己的內(nèi)部存儲(chǔ)器一樣。一旦主機(jī)完成了初始化進(jìn)程,各設(shè)備之間的所有存儲(chǔ)器地址都能被PCI接口翻譯出來(lái)。
術(shù)語(yǔ)“窗口”用于表示該設(shè)備可能還有不允許別的總線主控器共享的其他受保護(hù)資源。這種開(kāi)放的窗口清楚地表示了可以直接進(jìn)行傳送的存儲(chǔ)資源。這種方法是很重要的,因?yàn)閷?duì)任何給定設(shè)備都不需要內(nèi)核處理器參與每一件事務(wù)。
圖2的簡(jiǎn)單實(shí)例示出了主機(jī)中的窗口指向設(shè)備資源以及設(shè)備中的窗口指向主機(jī)資源。這就是允許單個(gè)的內(nèi)核處理器能將外部資源當(dāng)做簡(jiǎn)單的存儲(chǔ)器地址來(lái)訪問(wèn)的機(jī)制。
主機(jī)中的窗口指向設(shè)備資源以及設(shè)備中的窗口指向主機(jī)資源原理圖
通常采用郵箱中斷方式來(lái)協(xié)調(diào)總線主控器與PCI設(shè)備之間的數(shù)據(jù)傳送,這就使接收設(shè)備知道數(shù)據(jù)什么時(shí)候可用以及什么時(shí)候準(zhǔn)備用于處理。
數(shù)據(jù)傳送路徑
BF533有一組專用的外部主控器總線,允許外部的總線主控器直接從(或?qū)?內(nèi)部的L2存儲(chǔ)器或者芯片外的SDRAM傳送數(shù)據(jù)而無(wú)需內(nèi)核處理器的介入。另外,可以建立PCI映射以便允許訪問(wèn)某些系統(tǒng)資源,例如,共享的外圍設(shè)備。上述每種數(shù)據(jù)傳送方法都只需要不多的初始化代碼。內(nèi)核處理器只需要管理信號(hào)量以便指示什么時(shí)候可以交換數(shù)據(jù),以及什么時(shí)候可以將數(shù)據(jù)從該系統(tǒng)中傳送出去。
除了上述傳送路徑外,還有一種內(nèi)部的存儲(chǔ)器DMA控制器可以用于發(fā)起任一方向的數(shù)據(jù)傳送。這種數(shù)據(jù)傳送路徑能支持外圍設(shè)備間的突發(fā)傳送。
在支持PCI的嵌入式媒體處理器上實(shí)現(xiàn)視頻捕獲
下面將給出一種能執(zhí)行主機(jī)控制器和信號(hào)處理器任務(wù)的嵌入式媒體處理器的具體實(shí)例,目的是要說(shuō)明一種帶有集成PCI接口的嵌入式處理器是如何用在具有各種不同接口要求的系統(tǒng)中的。這里的重點(diǎn)是數(shù)據(jù)搬移以及接入許多基于PCI的主流外圍設(shè)備的能力。因?yàn)榘惭bPCI接口就跟安裝存儲(chǔ)器一樣,所以通過(guò)把這些外圍設(shè)備映射到一些存儲(chǔ)器的位置就極大地簡(jiǎn)化了編程模式。初始化完成后,每個(gè)外圍設(shè)備都會(huì)對(duì)主機(jī)處理器開(kāi)放一個(gè)窗口用于雙向的數(shù)據(jù)交換。
在本例中,采用Momentum Data Systems (MDS)公司的Eagle-35主板來(lái)迅速實(shí)現(xiàn)一個(gè)系統(tǒng),該P(yáng)CB的原理示意圖參見(jiàn)圖3和圖4。Eagle-35是一個(gè)單板計(jì)算機(jī)(SBC)的主處理器,該SBC有4個(gè)內(nèi)部PCI插槽,板內(nèi)還包含了一個(gè)以太網(wǎng)控制器,并且連接到PCI總線,采用一個(gè)廉價(jià)的PLD實(shí)現(xiàn)5設(shè)備的PCI判決器。它還包括了一個(gè)可連接SDRAM內(nèi)存模塊的插座,可以提供128MB的外部存儲(chǔ)器。
首先可以把一個(gè)視頻畫(huà)面捕獲卡安裝到其中一個(gè)PCI插槽中。利用照相機(jī)數(shù)據(jù)源或者視頻源的多路復(fù)用流,可以一次把一幀的視頻數(shù)據(jù)直接送入SDRAM。另外,每一路數(shù)據(jù)都可以直接進(jìn)入外部存儲(chǔ)器用于處理。為了說(shuō)明清楚,假定有一個(gè)安全應(yīng)用,它有一路輸入的CIF視頻流,從10MB/s數(shù)量級(jí)的數(shù)據(jù)壓縮至KB/s數(shù)量級(jí)范圍(具體取決于期望的壓縮圖像質(zhì)量等級(jí))。該視頻畫(huà)面捕獲卡上的一個(gè)DMA控制器直接將數(shù)據(jù)傳送到SDRAM中。因?yàn)锽F533有一個(gè)雙MAC/ALU的內(nèi)核處理器,所以可以實(shí)時(shí)地完成每一輸入幀的數(shù)據(jù)壓縮??梢蕴幚淼膲嚎s類(lèi)型有好幾種,包括MJPEG、MPEG-2以及MPEG-4。采用這些算法進(jìn)行CIF格式的壓縮僅消耗內(nèi)核處理器資源的很小一部分。
PCI接口有多種方法可以將壓縮后的數(shù)據(jù)從處理器傳送出去。一種方法是利用以太網(wǎng)控制器把壓縮數(shù)據(jù)流送到遠(yuǎn)程網(wǎng)絡(luò)地點(diǎn),另一種方法是利用一個(gè)IDE驅(qū)動(dòng)器來(lái)保存視頻,這兩種方法都接受PCI數(shù)據(jù)流,這樣就簡(jiǎn)化了需要的編程模式。因?yàn)锽F533的DSP處理能力既支持編碼也支持解碼,所以壓縮圖像可以重新傳回給同樣的系統(tǒng)。
在SDRAM中可提供多個(gè)輸入和輸出幀的緩沖器,這些緩沖器采用一種反復(fù)的方式輪流保存數(shù)據(jù)。當(dāng)一個(gè)輸入緩沖器充滿了來(lái)自視頻捕獲設(shè)備的數(shù)據(jù)時(shí),另外一個(gè)緩沖器的數(shù)據(jù)正在被壓縮。兩個(gè)輸出緩沖器允許輸出方向的并行操作。當(dāng)一個(gè)輸出緩沖器充滿了壓縮數(shù)據(jù)時(shí),另一個(gè)緩沖器中的數(shù)據(jù)可以被傳送到IDE驅(qū)動(dòng)器或者以太網(wǎng)接口中。
Eagle-35主板是一種ATX型的設(shè)備,所以適合于做一個(gè)PC機(jī)箱中的主板。為了方便訪問(wèn),音頻編解碼接口等所有的附加接口都放到了電路板的外部。有了板內(nèi)的編解碼器,就可以完成音頻的壓縮以便匹配視頻流。