當前位置:首頁 > 消費電子 > 視頻技術(shù)
[導(dǎo)讀]JPEG圖像硬件解碼低功耗技術(shù)方案 為了實現(xiàn)數(shù)據(jù)的實時處理和低功耗應(yīng)用,本文提出了一種帶有時鐘管理機制的并行、全流水結(jié)構(gòu)的JPEG解碼器實現(xiàn)方案。 目前,我國正在籌備物聯(lián)網(wǎng)的建設(shè),這對于傳感器技術(shù)

JPEG圖像硬件解碼低功耗技術(shù)方案

為了實現(xiàn)數(shù)據(jù)的實時處理和低功耗應(yīng)用,本文提出了一種帶有時鐘管理機制的并行、全流水結(jié)構(gòu)的JPEG解碼器實現(xiàn)方案。

目前,我國正在籌備物聯(lián)網(wǎng)的建設(shè),這對于傳感器技術(shù)的發(fā)展以及數(shù)字圖像傳感器瞬時產(chǎn)生的海量數(shù)據(jù)為實時通信系統(tǒng)的存儲容量、傳輸帶寬和功耗提出了挑戰(zhàn)。在醫(yī)療、遙感圖像通信等對恢復(fù)圖像質(zhì)量要求高的領(lǐng)域,對低功耗、具有良好壓縮/解壓縮性能及實時處理能力的圖像編/解碼器的需求也變得日益迫切。JPEG靜態(tài)圖像壓縮/解壓縮標準,具有優(yōu)良的壓縮/解壓縮性能,而且要求低存儲量和相對較低的復(fù)雜度使其很適合于硬件實現(xiàn)。

1 JPEG解碼算法
JPEG(Joint Photographic Experts Group)是一種適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標準。JPEG壓縮是一種有損壓縮,它利用了人的視覺系統(tǒng)特性,使用量化和無損壓縮編碼相結(jié)合的方式去掉視覺的冗余信息和數(shù)據(jù)本身的冗余信息。JPEG解碼器包括:霍夫曼(Huffman)解碼、反量化(IQ)和IDCT變換。在JPEG中,對于圖像的解碼是分塊進行的。整個圖像被劃分為若干個8×8的數(shù)據(jù)塊(MCU),每1個塊對應(yīng)于原圖像的1個8×8的像素陣列。各行的編解碼順序從上到下,行內(nèi)的編解碼順序從左到右[1]。
2 并行Huffman解碼器
Huffman編碼后代碼的長度不一致,如果解碼器用串行技術(shù)實現(xiàn),由于其代碼長度不一致,解1個碼字所需的周期數(shù)也不一樣。對于實時系統(tǒng),串行技術(shù)的效率比較低。另外,如果數(shù)據(jù)在傳播過程中被噪聲中斷,整組數(shù)據(jù)就變得沒有價值了。針對這兩方面的問題,本文提出如下的解決方案。如圖1所示為Huffman解碼的主要元件和算法流程。



算法流程:從輸入端獲取32位的壓縮圖像數(shù)據(jù),分析輸入的數(shù)據(jù)流,判斷出碼長,把輸入的數(shù)據(jù)移位,同時從輸入端補充新的數(shù)據(jù)。輸入的數(shù)據(jù)通過Huffman表翻譯成原始數(shù)據(jù),提取出數(shù)據(jù)流中嵌入的符號位,經(jīng)過一系列的除法、減法運算后得到編碼前的頻率數(shù)據(jù),與之前得到的符號位合并后輸送到輸出緩存。
本文采用的算法靈活地利用了Huffman表的特點,消除了算法中的乘法運算,完成碼長的判斷只需要1個周期。把碼表的數(shù)據(jù)按照碼長分類從小到大排列,再把碼長相同的數(shù)據(jù)按照碼字的大小從小到大排列。每張表按照排列后的順序把碼字對應(yīng)的解碼結(jié)果DR(Decoding Results)存入到ROM中。這樣既有利于查表,需要的ROM也是最小的,符合低功耗要求。查表的地址發(fā)生器由“長度匹配”模塊傳遞到的碼長得到1個基地址,碼長從輸入數(shù)據(jù)中截取連續(xù)的幾個與碼長相同位數(shù)的bit作為偏移地址,2個地址相加就是DR保存的地址[2]。
因關(guān)鍵bit出現(xiàn)的位置都是在碼字的最后幾位,因此根據(jù)碼長將輸入數(shù)據(jù)進行移位,使關(guān)鍵bit的最后1位出現(xiàn)在第n位,移位的結(jié)果只輸出第n位以前的幾個bit,這樣的電路只需要1個只受碼長控制的桶形移位寄存器。另外,再為每張表產(chǎn)生1個1串0加上1串1的地址修正串,有幾個關(guān)鍵bit就有幾個1,這部分電路邏輯簡單且占用的電路不多。用這個地址修正串和桶形移位寄存器的輸出做一個“與”邏輯運算,得到的就是正確的偏移地址。由于Huffman表需要的最長bit是9位,碼長最大為19位,所以本文設(shè)計了1個19位輸入、9位輸出的桶形移位寄存器。改進后的電路面積縮小到改進前的50%左右。
3 IDCT處理器
逆向離散余弦變換IDCT(Inverse Discrete Cosine Transform)電路的總體實現(xiàn)框圖和其中的2D IDCT框圖如圖2所示。DCT系數(shù)經(jīng)過反量化和反掃描電路處理后輸入到IDCT的緩存器,由全局控制電路控制輸入到2D IDCT單元及將最終變換好的數(shù)據(jù)送到輸出緩存器中,發(fā)送Ready信號到運動補償單元,通知該單元可以讀出IDCT數(shù)據(jù)。2D IDCT單元進行2次1D IDCT運算,首先進行基于行的1D IDCT,然后將第1次IDCT的中間結(jié)果經(jīng)轉(zhuǎn)置存儲器進行轉(zhuǎn)置處理和緩存,再進行基于列的1D IDCT變換,得到最終的IDCT變換結(jié)果[3]。



IDCT設(shè)計中使用了零值判斷邏輯電路、門控時鐘、并行流水線等技術(shù),使得整個電路在滿足處理速度和精度要求的基礎(chǔ)上大大降低了功耗。
3.1 零值判斷邏輯電路
在整個圖像解碼過程中,每8×8個數(shù)據(jù)塊中有約90%的數(shù)據(jù)的DCT系數(shù)為零,對這些零值進行IDCT變換并無意義。因此,本設(shè)計添加了零值判斷邏輯來消除不必要的乘法運算。零值判斷邏輯電路由8×8累加器陣列、零值判斷邏輯模塊和復(fù)選器MUX構(gòu)成。通過零值邏輯模塊判斷,當操作數(shù)不全為零時,使能信號變成高電平,將操作數(shù)取到寄存器中,然后再進行乘法運算。如果操作數(shù)全為零,則封鎖累加陣列,直接通過MUX輸出0。零值判斷邏輯能有效地降低功耗,且電路簡單,面積與延遲時間幾乎可以忽略不計。
3.2 基于鎖存器的門控時鐘
通過控制電路的輸入時鐘可以使得一部分電路降低工作頻率或者停止工作,從而降低整個電路的功耗。2D DCT/IDCT的電路主要由3部分組成:1D DCT/IDCT單元、轉(zhuǎn)置存儲器、輸入輸出處理單元。
轉(zhuǎn)置存儲器部分只有在每次1D DCT/IDCT處理的最后才進行更新,而輸入輸出處理單元只有在數(shù)據(jù)輸入輸出的時候才工作。因此,控制這幾部分電路的輸入時鐘,使其在大多數(shù)時間停止工作即可以有效地降低功耗。設(shè)計結(jié)果表明,在面積僅增加2%的情況下系統(tǒng)功耗可降低13%。
基于鎖存器的門控時鐘可以實現(xiàn)上述功能,它具有不需要數(shù)據(jù)選擇器、面積較小、可以減小時鐘網(wǎng)絡(luò)上電容、減少門控寄存器的內(nèi)部功耗等優(yōu)點。鎖存器門控時鐘電路及時序如圖3所示。



3.3 并行流水線
本設(shè)計使用加法和移位運算代替IDCT快速算法中的浮點乘法運算單元,用高度并行流水線VLSI結(jié)構(gòu)加快數(shù)據(jù)處理速度,其處理數(shù)據(jù)的時間不到串行結(jié)構(gòu)的1/5。因此,時鐘頻率可以相應(yīng)地降低到串行結(jié)構(gòu)的1/5左右,從而降低系統(tǒng)的功耗。例如,使用2個16×8的乘法器同時并行計算高位部分和低位部分,分別得到高位部分積和低位部分積,然后進行移位相加。實現(xiàn)電路運算時實現(xiàn)時間重疊、資源重復(fù)使用和資源共享,提高了系統(tǒng)的并行性,以此提高了乘法電路的運行速度和效率。
4 仿真和綜合結(jié)果
本文選用1幅1 920×1 080大小的JPEG圖像,Modelsim進行RTL級仿真后的波形如圖4所示。圖中JPEG_DATA是碼流數(shù)據(jù),OutR、OutG、OutB是解碼仿真結(jié)果[4]。在100 MHz的頻率下對解碼核心模塊進行綜合[5],結(jié)果如表1所示。



本文有別于以往用軟件實現(xiàn)JPEG解碼,而是在用硬件實現(xiàn)JPEG解碼的同時,改進硬件結(jié)構(gòu),通過多種易于操作的方法來降低硬件解碼能耗。通過EDA工具驗證,完全可以滿足JPEG圖像硬件解碼的要求。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉