當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式硬件

引言   隨著cpu速度的迅速提高,cpu與片外存儲(chǔ)器的速度差異越來(lái)越大,匹配cpu與外部存儲(chǔ)器的方法通常是采用cache或者片上存儲(chǔ)器。微處理器中片上存儲(chǔ)器結(jié)構(gòu)通常包含指令cache ,數(shù)據(jù)cache 或者片上存儲(chǔ)器。對(duì)于嵌入式設(shè)備上的數(shù)據(jù)密集的應(yīng)用,數(shù)據(jù)cache 與片上存儲(chǔ)器相比存在以下缺陷:(1) 片上存儲(chǔ)器是固定的單周期訪(fǎng)問(wèn),可在設(shè)計(jì)時(shí)而不是運(yùn)行時(shí)研究數(shù)據(jù)訪(fǎng)問(wèn)模式;而cache還要考慮擊不中的情況,因而有可變的數(shù)據(jù)訪(fǎng)問(wèn)時(shí)間,執(zhí)行時(shí)間的預(yù)測(cè)更加困難。(2) 使用cache 執(zhí)行時(shí)間的不可預(yù)測(cè)性影響編譯器的優(yōu)化;(3) 細(xì)顆粒的cache 對(duì)于圖像編碼等的規(guī)則數(shù)據(jù)訪(fǎng)問(wèn)并不合適,因而使用cache 對(duì)于嵌入式設(shè)備可能不是最優(yōu)的。文指出,對(duì)于大多數(shù)應(yīng)用,使用片上存儲(chǔ)器比使用數(shù)據(jù)cache能量平均大約節(jié)省40 % ,芯片面積與時(shí)間的乘積僅為cache的46%。因而對(duì)于嵌入式多媒體處理器,片上ram作為數(shù)據(jù)cache的替代,功耗更低。片上存儲(chǔ)器的有效使用對(duì)于提高嵌入式應(yīng)用的速度,降低功耗具有重要的意義。   文討論了在同時(shí)具有數(shù)據(jù)cache和片上sram的處理器上標(biāo)量和矩陣變量的存儲(chǔ)器分配方法。文以摩托羅拉公司的dsp56000為平臺(tái),文以ams gepard dsp為平臺(tái),分別討論了如何把數(shù)據(jù)分配到x/y數(shù)據(jù)存儲(chǔ)器塊,以便最大限度地利用數(shù)據(jù)移動(dòng)的并行性。dsp56000片上x(chóng)、y數(shù)據(jù)存儲(chǔ)器都是單端口的,并且容量較小。與dsp56000不同,ti公司的tms320c55x具有更多的數(shù)據(jù)總線(xiàn),片上ram容量更大,且分塊多,具有訪(fǎng)問(wèn)能力更強(qiáng)的daram。   tms320c55x具有極低的功耗(0.05mw/mips) ,非常適合手持設(shè)備,現(xiàn)在已經(jīng)集成至ti 公司專(zhuān)門(mén)針對(duì)3g手機(jī)的高性能多媒體處理器上。c55x 片上除了24k字節(jié)的指令cache外,還有64k字節(jié)的雙端口存儲(chǔ)器(daram),96k字節(jié)的單端口存儲(chǔ)器(saram)。daram和saram總共160k字節(jié),分成20個(gè)塊,每個(gè)塊8k字節(jié)。本文以c55x的視頻編碼器為例,討論片上存儲(chǔ)器的有效使用。   數(shù)據(jù)的片外、片上動(dòng)態(tài)分配   因?yàn)槠洗鎯?chǔ)器比片外存儲(chǔ)器具有更高的數(shù)據(jù)訪(fǎng)問(wèn)能力和更小的訪(fǎng)問(wèn)功耗,所以盡可能分配數(shù)據(jù)到片上存儲(chǔ)器,未能分配到片上的數(shù)據(jù)可在cpu處理前轉(zhuǎn)移到片上,已經(jīng)轉(zhuǎn)移到片上的數(shù)據(jù),應(yīng)盡可能在片上保存直到其生命期結(jié)束,以便盡可能減少數(shù)據(jù)從片外存儲(chǔ)器到片上存儲(chǔ)器的數(shù)據(jù)轉(zhuǎn)移。在視頻編碼等應(yīng)用中,標(biāo)量、常數(shù)相對(duì)于矩陣而言,通常數(shù)量較少,可以分配到片上;若分配到片外,在運(yùn)算時(shí)直接存取片外數(shù)據(jù),cpu流水線(xiàn)將會(huì)停滯。直接存儲(chǔ)器存取(dma)可以在存儲(chǔ)器之間,存儲(chǔ)器與外設(shè)之間轉(zhuǎn)移數(shù)據(jù),除了dma通道參數(shù)初始化以外,dma轉(zhuǎn)移數(shù)據(jù)和cpu處理數(shù)據(jù)可以并行進(jìn)行。設(shè)置dma通道參數(shù)需要一定的時(shí)間,采用dma來(lái)轉(zhuǎn)移單個(gè)變量或常數(shù)的開(kāi)銷(xiāo)可能比直接存取更大,因此dma適合轉(zhuǎn)移具有較多數(shù)據(jù)的矩陣,并不適合片外標(biāo)量的轉(zhuǎn)移。包含大量元素的矩陣可以分配到片外,處理前使用dma轉(zhuǎn)移到片上存儲(chǔ)器。   局部變量由編譯器分配到軟件棧上,c55x具有兩個(gè)軟件棧:數(shù)據(jù)棧和系統(tǒng)棧。c55x的棧有三種工作模式,可設(shè)置成雙16比特快返回模式,以減少棧所占的存儲(chǔ)器空間,并提高其運(yùn)行速度。數(shù)據(jù)棧和系統(tǒng)棧在函數(shù)調(diào)用及返回時(shí)同時(shí)訪(fǎng)問(wèn),可將這兩個(gè)棧分配到daram塊或者不同的saram塊內(nèi)。   本文中數(shù)據(jù)存儲(chǔ)器的分配,強(qiáng)調(diào)從實(shí)際多媒體應(yīng)用處理的基本數(shù)據(jù)塊出發(fā),分析簡(jiǎn)單直觀(guān)。多媒體算法總是將原始輸入數(shù)據(jù)分成一定大小的塊進(jìn)行處理,并產(chǎn)生對(duì)應(yīng)該輸入的最后輸出。如果片上沒(méi)有足夠的存儲(chǔ)器,大量的輸入數(shù)據(jù)和最后結(jié)果僅能可存儲(chǔ)在片外。對(duì)于元素較多的矩陣,可以根據(jù)算法特征將矩陣分成若干數(shù)據(jù)子塊,如h.263編碼器中的宏塊,搜索窗等,或者單純根據(jù)可得到的片上存儲(chǔ)器數(shù)量分成適當(dāng)大小的子塊逐個(gè)運(yùn)算,然后分析數(shù)據(jù)子塊的生命期和使用頻率。我們定義數(shù)據(jù)子塊的生命期為首次使用到最后一次使用之間的間隔,而通常變量的生命期為定義到最后使用之間的間隔,例如定義整型數(shù)組int mb[384],用來(lái)存儲(chǔ)待編碼宏塊的數(shù)據(jù),圖像的某個(gè)宏塊的數(shù)據(jù)在該宏塊編碼結(jié)束后,該宏塊數(shù)據(jù)的生命期也就結(jié)束,然后該數(shù)組用來(lái)存儲(chǔ)下一宏塊的數(shù)據(jù),因而變量的生命期遠(yuǎn)比存儲(chǔ)在該變量中的某一具體數(shù)據(jù)生命期要長(zhǎng)。若數(shù)據(jù)子塊具有不相交的生命期,則可以共享相同的片上存儲(chǔ)器。  很多數(shù)據(jù)子塊在運(yùn)算中多次使用,可在首次運(yùn)算前轉(zhuǎn)移到片上,并盡可能保存到生命期結(jié)束,即直到這些數(shù)據(jù)不再使用為止,因而這些數(shù)據(jù)僅需要一次轉(zhuǎn)移。將程序執(zhí)行時(shí)間看成是由很多連續(xù)的時(shí)間間隔組成的,若在下個(gè)時(shí)間間隔內(nèi)需要轉(zhuǎn)移新的數(shù)據(jù)到片上供cpu處理,而片上又沒(méi)有足夠的存儲(chǔ)器存儲(chǔ)這些數(shù)據(jù),這時(shí)將隨后需要連續(xù)頻繁使用的數(shù)據(jù)保留到片上;對(duì)于隨后較少使用的數(shù)據(jù),若片外存儲(chǔ)器還保存有該數(shù)據(jù)的備份,這些數(shù)據(jù)可直接覆蓋,等到下次使用時(shí)再?gòu)钠獯鎯?chǔ)器拷貝到片上;否則,在覆蓋前將數(shù)據(jù)轉(zhuǎn)移到片外。在片上分配一定的緩沖區(qū),用來(lái)存儲(chǔ)需要再次使用

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀(guān)點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話(huà)語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉