當(dāng)前位置:首頁 > 嵌入式 > 嵌入式硬件
[導(dǎo)讀]引言   隨著多媒體和網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)字圖像大信息量的特點(diǎn)對圖像壓縮技術(shù)的要求越來越高,因此,專用高速數(shù)字信息處理技術(shù)成為發(fā)展的方向。其中,在硬件技術(shù)中,TI推出的C5000系列DSP將數(shù)字信號處

引言

隨著多媒體和網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)字圖像大信息量的特點(diǎn)對圖像壓縮技術(shù)的要求越來越高,因此,專用高速數(shù)字信息處理技術(shù)成為發(fā)展的方向。其中,在硬件技術(shù)中,TI推出的C5000系列DSP將數(shù)字信號處理器的處理能力提升到了一個新的高度,使信號處理系統(tǒng)的研究重點(diǎn)又回到軟件算法上。在壓縮算法研究方面,DCT、小波等多個算法因為其高可靠性和高效性也越來越受到青睞。

系統(tǒng)硬件設(shè)計

TMS320C5409作為主處理器的可行性分析

TMS320C5409時鐘頻率為100MHz,性價比極高。采用圍繞1組程序總線、3組數(shù)據(jù)總線和4組地址總線建立的改進(jìn)型哈佛結(jié)構(gòu),取址和讀數(shù)可同時進(jìn)行。有獨(dú)立的硬件乘法器,有利于實(shí)現(xiàn)優(yōu)化卷積、數(shù)字濾波、FFT、矩陣運(yùn)算等算法中的大量重復(fù)乘法運(yùn)算。具有循環(huán)尋址、位倒序等特殊指令,這些指令使FFT、卷積等運(yùn)算中的尋址、排序及計算速度大大提高。有一組或多組獨(dú)立的DMA總線,與CPU的程序、數(shù)據(jù)總線并行工作。

在本系統(tǒng)中,TMS320C5409作為主處理器,任務(wù)是實(shí)現(xiàn)JPEG壓縮編碼。

通過分析不難得到,當(dāng)處理一幀大小為640×480的圖像時,作JPEG壓縮編碼所需要的時間為:T=62×10(ns)×640×480=0.19866s,當(dāng)所處理的圖像分辨率更小時,則壓縮每幀所花的時間更少,這對于應(yīng)用在對實(shí)時性要求不是很高的場合是完全可行的。

硬件設(shè)計框圖

圖1是基于TMS320C5409的圖像處理系統(tǒng)結(jié)構(gòu)圖。C5409為中央處理器,SRAM為DSP片外擴(kuò)展數(shù)據(jù)存儲器,EEPROM為脫機(jī)工作時的程序存儲器,用于存儲系統(tǒng)的引導(dǎo)程序和其它應(yīng)用程序,A/D轉(zhuǎn)換部分負(fù)責(zé)把轉(zhuǎn)換為數(shù)字信號的圖像存入幀存儲器中。地址譯碼、圖像采集系統(tǒng)控制電路產(chǎn)生本系統(tǒng)各部分的地址譯碼信號,使之映射到不同的地址區(qū)域,并控制ADC進(jìn)行圖像采集,這部分由CPLD控制;圖像采集芯片的寄存器控制由51單片機(jī)完成。


存儲空間的擴(kuò)展方案

經(jīng)過A/D轉(zhuǎn)換的原始圖像數(shù)據(jù)是非常大的,TMS320C5409的內(nèi)部僅有32KB的RAM和16KB的ROM,不能滿足需要,因此,必須擴(kuò)展存儲器來存放原始圖像數(shù)據(jù)和應(yīng)用程序。本文考慮外接64KB的RAM和512KB的Flash,RAM使用Cypress公司的CY7C1021V33,F(xiàn)lash采用SST公司的SST39VF512。由于C5409的數(shù)據(jù)空間僅為64KB,因此采用內(nèi)存頁擴(kuò)展技術(shù)。C5409的擴(kuò)展輸出口1Q和2Q作為擴(kuò)展內(nèi)存的頁選擇信號。用C5409的A15引腳和XF引腳通過3/8譯碼器來控制擴(kuò)展存儲器片選信號的產(chǎn)生,當(dāng)A15=0時,選擇片內(nèi)RAM;當(dāng)A15=1,XF=0時選擇片外SRAM;當(dāng)A15=1,XF=1時選擇片外Flash;存儲器的擴(kuò)展如圖2所示。將外部擴(kuò)展RAM的64KB中的48KB用于存放原始圖像數(shù)據(jù),16KB用于存放壓縮后的圖像和程序以及暫存的數(shù)據(jù)。


DSP芯片電源電路設(shè)計

電源設(shè)計中需要考慮的主要問題是功率和散熱。功率要求:電流的消耗主要取決于器件的激活度,即CPU的激活度,外設(shè)功耗主要取決于正在工作的外設(shè)及其速度,與CPU相比,外設(shè)功耗是比較小的。以TMS320C5409為例,進(jìn)行FFT運(yùn)算時,需要的電源電流最大。因此在設(shè)計電源時,必須考慮在電源電流和實(shí)際需用電流之間留有一定裕量,因為峰值電流會更大,裕量至少是20%。

C5409采用了雙電源供電機(jī)制,工作電壓為3.3V和1.8V。其中,1.8V主要為DSP的內(nèi)部邏輯提供電壓,包括CPU和其它所有外設(shè)邏輯。外部接口引腳采用3.3V電壓。本系統(tǒng)的電源采用了TI公司的兩路輸出電源芯片TPS73HD318,它是一種雙輸出穩(wěn)壓器。輸出電壓一路為3.3V、一路為1.8V,每路電源的最大輸出電流為750mA。

JPEG圖像壓縮算法

JPEG算法的優(yōu)化

盡管JPEG基本系統(tǒng)能夠?qū)D像進(jìn)行低壓縮比壓縮,但是DCT和IDCT在軟件實(shí)現(xiàn)的過程中,是最耗費(fèi)時間的運(yùn)算,而且,由于沒有考慮圖像本身的頻譜特性,JPEG量化表對于所有圖像壓縮并不一定最優(yōu)。采用快速DCT算法可提高軟件的速度,增強(qiáng)軟件的實(shí)時性。同時,根據(jù)圖像本身的頻譜特性,自適應(yīng)改進(jìn)JPEG推薦的量化表。

快速DET算法

如果將一幅圖像分成許多8×8的小塊后直接進(jìn)行2D—DCT變換,運(yùn)算量將會十分巨大。因此,需要將8×8二維DCT變換轉(zhuǎn)換成兩次8點(diǎn)的一維DCT復(fù)合運(yùn)算。具體做法是對每一個8×8塊先做列方向上的DCT變換,得到一個中間矩陣,再對該矩陣各行進(jìn)行DCT變換。可以看到,8×8矩陣的2維DCT可以轉(zhuǎn)換成16次一維8點(diǎn)DCT。

目前,很多針對一維DCT運(yùn)算的DCT快速算法已經(jīng)提出。其中,Loeffler算法所需要的計算量最小。Loeffler算法將8點(diǎn)一維DCT運(yùn)算分為4級,由于各級之間的輸入/輸出存在依存關(guān)系,4級操作必須串行進(jìn)行,而各級內(nèi)部的運(yùn)算可并行處理。

流程圖中有三種運(yùn)算因子:蝶形因子、旋轉(zhuǎn)因子和倍乘因子,分別如圖3中的a,b,c所示。蝶形因子的運(yùn)算關(guān)系為:


D0=I0+I1
O1=I0-I1
需要2次加法完成,倍乘因子的輸入/輸出關(guān)系比較簡單:,只需1次乘法,旋轉(zhuǎn)因子的運(yùn)算關(guān)系為:


需4次乘法、2次加法完成。如果對其輸入/輸出關(guān)系式做以下變換:


只需要3次乘法、3次加法。其中,和差都是已知系數(shù),可通過查表獲得。

由此計算可知,一個8點(diǎn)DCT的Loeffler算法共需要11次乘法和29次加法。從DSP匯編語言編程的角度來看,一個代數(shù)運(yùn)算應(yīng)包括取操作數(shù)、運(yùn)算、存操作數(shù)三個步驟。因此,該算法大約需要120條指令。C5409的運(yùn)算能力很強(qiáng),支持單周期加/減法和單周期乘法運(yùn)算,并且能夠在單周期內(nèi)完成兩個16位數(shù)的加/減法運(yùn)算,再加上DSP中有3組數(shù)據(jù)總線,因而可以利用長操作數(shù)(32位)進(jìn)行長字運(yùn)算。在長字指令中,給出的地址存取的總是高16位操作數(shù),因而只需5條長字指令即可計算2個蝶形運(yùn)算。加上采取其它優(yōu)化措施,大約需90條指令完成Loeffler算法。

雖然Loeffler算法運(yùn)算量最小,但是運(yùn)用于本文系統(tǒng)并不是最優(yōu)。因為該算法是為高級語言設(shè)計,沒有利用匯編語言的特點(diǎn)和DSP硬件的特點(diǎn)。本文提出了基于DSP乘法累加單元的DCT快速算法。

DSP的乘法累加單元能在單周期內(nèi)完成一次乘法和一次累加運(yùn)算。如匯編指令運(yùn)用于DCT運(yùn)算,將大大簡化程序的復(fù)雜度并減少計算時間。具體算法如下,利用蝶形運(yùn)算:


從上面表達(dá)式可以看出,y(0)-y(7)都是乘法累加運(yùn)算,而s0-s7可由x(0)一x(7)經(jīng)過蝶形運(yùn)算得到,因此,DCT算法由原來的4級運(yùn)算變成兩級,即第一級蝶形運(yùn)算和第二級乘法累加運(yùn)算,第一級蝶形運(yùn)算共要10+4=14(10次計算操作和4次輔助操作)條指令,第二級運(yùn)算中,每個輸出要4+1+1=6條指令(做4次乘法累加運(yùn)算、1次讀取操作和1次存儲操作),一共48條指令,這樣,計算一個8點(diǎn)DCT要62條指令,大大縮減了運(yùn)算時間,提高了CPU的工作效率,增強(qiáng)系統(tǒng)的實(shí)時性。

量化運(yùn)算優(yōu)化

本文提出了基于實(shí)際情況的自適應(yīng)量化方法,即量化階段采用二次計算的方法,其算法主要分為兩步:(1)對變換后的圖像系數(shù)進(jìn)行自適應(yīng)處理;(2)構(gòu)造新的量化表。具體方法如下:

首先求出亮度分量和兩個色度分量在頻域中所有8×8子塊的63個交流系數(shù)絕對值的平均值P(u,v),其中,u,v=0…7為位置信息。接下來求出163個交流系數(shù)平均值中的最大值,Z1(u,v)=MAX[P1(u,v)],最后將63個交流系數(shù)平均值進(jìn)行歸一化處理,同時加入頻率位置信息,分別得出亮度和色度量化表中63個交流分量的矯正系數(shù),計算過程為:


由此可以得到量化表的矯正式Qpl(u,v)=Q1(u,v)/X1(u,v),對JPEG量化表進(jìn)行矯正。

將上述矯正后的量化表作為最終的量化表,對圖像進(jìn)行標(biāo)準(zhǔn)JPEG壓縮,形成完全符合JPEG格式的壓縮文件。本算法的解碼過程與標(biāo)準(zhǔn).JPEG解碼過程完全相同,可以看出它也是標(biāo)準(zhǔn).IPEG編碼過程的逆過程。

實(shí)驗結(jié)果

快速DCT運(yùn)算

將本文提出的算法、Loeffler的DSP優(yōu)化算法和純Loeffler算法分別進(jìn)行測試。結(jié)果見表1,可以看到本文算法較Loeffler的DSP優(yōu)化算法大約節(jié)省了1/4的時間,較純Loeffler算法大約節(jié)省了一半時間,其效果是十分明顯的。


自適應(yīng)量化

對自適應(yīng)量化器進(jìn)行仿真。本文采用中等復(fù)雜度的標(biāo)準(zhǔn)圖像作為測試圖,與基本JPEG系統(tǒng)進(jìn)行性能比較(基于峰值信噪比(PSNR))。只將JPEG標(biāo)準(zhǔn)方法中的量化表更改為修正的量化表,就可以在同等壓縮比下,提高恢復(fù)圖像的質(zhì)量。表2為不同壓縮比下,采用JPEG量化表和自適應(yīng)量化表兩種方法的峰值信噪比。從壓縮比和峰值信噪比的對比結(jié)果可看出,自適應(yīng)量化JPEG方法的壓縮比略高于標(biāo)準(zhǔn)JPEG方法。


結(jié)語

本文以TI的TMS320C5409作為開發(fā)平臺,實(shí)現(xiàn)了一種新的JPEG圖像壓縮系統(tǒng)。該系統(tǒng)的優(yōu)點(diǎn)是提高了JPEG的運(yùn)行速度,增強(qiáng)了圖像的壓縮率和質(zhì)量,并且易于硬件實(shí)現(xiàn)。這一方案可應(yīng)用于需要對視頻圖像進(jìn)行實(shí)時采集、壓縮及存儲的絕大部分場合。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉