當(dāng)前位置:首頁(yè) > 消費(fèi)電子 > 消費(fèi)電子
[導(dǎo)讀]本項(xiàng)目實(shí)現(xiàn)的編碼器需要實(shí)現(xiàn)實(shí)時(shí)音視頻采集、實(shí)時(shí)編碼、實(shí)時(shí)通過以太網(wǎng)以MPEG2 TS流的形式輸出碼流的功能。

    AVS-M是AVS標(biāo)準(zhǔn)的第7部分——一款專門為移動(dòng)通訊環(huán)境而設(shè)計(jì)的視頻編解碼標(biāo)準(zhǔn)。本項(xiàng)目的目的是要驗(yàn)證AVS-M在應(yīng)用環(huán)境中的性能表現(xiàn),借此證明該標(biāo)準(zhǔn)的實(shí)用價(jià)值,為其在國(guó)內(nèi)的產(chǎn)業(yè)化過程作貢獻(xiàn)。移動(dòng)通訊終端具有帶寬低,誤碼率高和計(jì)算能力弱等特點(diǎn),目前主要以MPEG-4 SP為視頻編解碼的標(biāo)準(zhǔn),今后國(guó)際上可能的升級(jí)方案有H.264和VC-1等。本項(xiàng)目通過在相同測(cè)試環(huán)境下對(duì)比AVS-M與H.264標(biāo)準(zhǔn)的實(shí)際性能表現(xiàn)來證明AVS-M標(biāo)準(zhǔn)的實(shí)用價(jià)值。為了貼近真實(shí)的使用環(huán)境,本項(xiàng)目實(shí)現(xiàn)的編碼器需要實(shí)現(xiàn)實(shí)時(shí)音視頻采集、實(shí)時(shí)編碼、實(shí)時(shí)通過以太網(wǎng)以MPEG2 TS流的形式輸出碼流的功能。

    VLC與x264是兩款遵循GPL標(biāo)準(zhǔn)發(fā)布的開源軟件,其中VLC是一個(gè)流媒體平臺(tái),支持插件功能;x264是一款H.264編碼庫(kù),并針對(duì)x86平臺(tái)進(jìn)行了優(yōu)化。為了盡快取得驗(yàn)證結(jié)果,本項(xiàng)目采用VLC和x264項(xiàng)目為設(shè)計(jì)的出發(fā)點(diǎn)。VLC以插件的形式實(shí)現(xiàn)了實(shí)時(shí)音視頻采集,H.264編碼,MPEG2 TS流復(fù)用和以太網(wǎng)輸出等功能,恰好契合本項(xiàng)目的總體需求;AVS-M標(biāo)準(zhǔn)起源于于H.264標(biāo)準(zhǔn),兩者結(jié)構(gòu)類似、功能相同,以H.264為基礎(chǔ)開發(fā)AVS-M標(biāo)準(zhǔn)能加快開發(fā)進(jìn)度,并且采用同一代碼樹也能更好的比較AVS-M與H.264標(biāo)準(zhǔn)的實(shí)際性能差異。為了更符合實(shí)際的使用環(huán)境,本項(xiàng)目采用AAC+作為音頻的編碼標(biāo)準(zhǔn)。VLC本身并不支持AAC+的編碼功能,而只支持其解碼功能,在此采用3GPP工程的26410-700作為AAC+標(biāo)準(zhǔn)的實(shí)現(xiàn),通過插件的方式來實(shí)現(xiàn)AAC+音頻編碼功能。

    VLC不但支持音視頻數(shù)據(jù)的采集、編碼、復(fù)用和以太網(wǎng)發(fā)送功能,而且還支持碼流的以太網(wǎng)接收、解復(fù)用、解碼和播放功能。為了驗(yàn)證編碼器的實(shí)際編碼效果,本項(xiàng)目也采用VLC作為碼流的接收端,通過實(shí)時(shí)觀看播放的效果來評(píng)判編碼器的性能表現(xiàn)。支持AVS-M解碼功能的VLC為另一項(xiàng)目的開發(fā)成果,在本文不作詳細(xì)描述。

編碼器

    音頻和視頻編碼都是計(jì)算密集型的操作,如果要實(shí)時(shí)編碼就需要一個(gè)強(qiáng)勁的運(yùn)算平臺(tái),這里采用一臺(tái)Dell PowerEdge 2950 服務(wù)器作用編碼器的硬件基礎(chǔ)。PowerEdge 2950配置有一顆Intel Xeon 5160 (Woodcrest) 3.0GHz雙核CPU、1GB DDR2內(nèi)存、SATA II 硬盤、內(nèi)置雙Broadcom BCM5708C NetXtreme II GigE千兆以太網(wǎng)控制器,并具有兩條PCI-X擴(kuò)展插槽以擴(kuò)充外設(shè)接口功能。操作系統(tǒng)選用Red Hat Enterprise Linux 4 (32bit)操作系統(tǒng)。

    PowerEdge 2950本身不具有音視頻采集接口,需要通過相應(yīng)的采集卡擴(kuò)展。這里采用一塊Osprey 230采集卡作為實(shí)時(shí)音視頻采集接口,它采用PCI-X接口形式,支持PAL/NTSC/SECAM視頻標(biāo)準(zhǔn),能實(shí)時(shí)采集一路標(biāo)清視頻及雙聲道的音頻。以太網(wǎng)輸出采用PowerEdge 2950內(nèi)置的千兆以太網(wǎng)接口。編碼器的整體框圖如下圖所示:

    整個(gè)編碼了流程為:PAL/NTSC/SECAM的視頻信號(hào)通過Composite或S-Video接口,音頻通過雙聲道音頻接口進(jìn)入Osprey 230 采集卡;Osprey 230由Video4Linux2與OSS驅(qū)動(dòng)程序來驅(qū)動(dòng),VLC通過這兩個(gè)接口控制采集卡,實(shí)時(shí)讀取音視頻數(shù)據(jù),并分別將音視頻數(shù)據(jù)送到AVS-M編碼器與AAC+編碼器進(jìn)行編碼;編碼后生成的碼流送到MPEG2 TS 復(fù)用器進(jìn)行復(fù)用;復(fù)用后的TS流通過以太網(wǎng)接口以UDP單播或組播的方式發(fā)送出去。

1 編碼庫(kù)

    開發(fā)支持AVS-M標(biāo)準(zhǔn)的編碼庫(kù)是本項(xiàng)目的重點(diǎn),根據(jù)AVS-M標(biāo)準(zhǔn)與H.264標(biāo)準(zhǔn)的異同對(duì)x264編碼庫(kù)進(jìn)行修改,修改的原則是在不改變?cè)菻.264編碼功能的前提下增加AVS-M編碼功能。為了同時(shí)支持上述兩個(gè)標(biāo)準(zhǔn),在此采用運(yùn)行時(shí)開關(guān)的方法使得編碼庫(kù)既支持H.264標(biāo)準(zhǔn)又支持AVS-M標(biāo)準(zhǔn),并且兩者可以動(dòng)態(tài)地切換。如下是在開發(fā)過程中涉及的兩個(gè)標(biāo)準(zhǔn)的不同部分。

a)NAL層

    AVS-M和H.264類似,碼流的基本單元都是NAL,每個(gè)NAL可以包含序列頭、圖像頭和條帶等多種語(yǔ)法結(jié)構(gòu)。不同之處是H.264中為了避免與起始碼混淆,當(dāng)NAL內(nèi)部出現(xiàn)0x000001時(shí),要在0x01之前插入一個(gè)0x03。所以我們?cè)趯?shí)現(xiàn)AVS-M時(shí),要把這個(gè)插入0x03的模塊刪除。

b)條帶上層語(yǔ)義

    在AVS-M中,有和H.264相對(duì)應(yīng)的序列參數(shù)集和圖像參數(shù)集。另外AVS-M增加了圖像頭,這使得每幀圖像數(shù)據(jù)的邊界清晰明了,方便了解碼器的實(shí)現(xiàn)。我們?cè)趯?shí)現(xiàn)AVS-M時(shí),也要相應(yīng)地加入圖像頭的支持。

c)幀內(nèi)預(yù)測(cè)

    在亮度幀內(nèi)預(yù)測(cè)中,AVS-M和H.264都有9種模式,但是他們的排列順序是不相同的,如圖1所示。

    在實(shí)現(xiàn)過程中,我們使用了一個(gè)映射表將兩種不同的排列順序聯(lián)系起來,使得代碼的改動(dòng)達(dá)到了最小。當(dāng)然我們也要按照標(biāo)準(zhǔn)修改幀內(nèi)預(yù)測(cè)的細(xì)微差別。

    另外,AVS-M中只有4x4一種幀內(nèi)預(yù)測(cè)模式,而H.264還有16x16和8x8兩種模式,所以我們要關(guān)掉兩種不用的模式。在色度方面,AVS-M不用基于“平面”的預(yù)測(cè),所以也要把它從X264中去掉。最后還要注意,在幀間預(yù)測(cè)幀(P幀)中如果出現(xiàn)幀內(nèi)預(yù)測(cè)宏塊,它的相鄰幀間預(yù)測(cè)塊的幀內(nèi)預(yù)測(cè)模式的預(yù)測(cè)值在AVS-M中被定義為不可用(-1),而在H.264中被定義為DC預(yù)測(cè)模式(2)。

d)運(yùn)動(dòng)向量預(yù)測(cè)

    在AVS-M中,當(dāng)前塊的運(yùn)動(dòng)向量預(yù)測(cè)是使用它左下角、上方和右上角的運(yùn)動(dòng)向量,而H.264是使用左上角、上方和右上角的運(yùn)動(dòng)向量,如圖2所示。

    另外,運(yùn)動(dòng)向量預(yù)測(cè)值的計(jì)算方法也略有不同。

e)分?jǐn)?shù)像素插值

    在AVS-M和H.264中,半像素精度的樣本值都是使用雙線性插值的方法,當(dāng)然它們使用了不同的濾波器。最需要注意的是,在水平和垂直方向都是四分之一精度的樣本預(yù)測(cè)時(shí),AVS-M使用的是“星形”法,而H.264使用的是“菱形”法,如圖3所示。

    在AVS-M中,e,g,p和r采用下面公式計(jì)算。

e=( F+j+1 ) >> 1


g=( G+j+1 ) >> 1


p=( N+j+1 ) >> 1


r=( O+j+1 ) >> 1

    而在H.264中,e,g,p和r采用下面公式計(jì)算。

e=( b+h+1 ) >> 1


g=( b+m+1 ) >> 1


p=( h+t+1 ) >> 1


r=( m+t+1 ) >> 1

f)變換和反變換

    AVS-M和H.264使用了類似的整數(shù)DCT變換,需要注意的是色度方面。在AVS-M中,色度使用了和亮度相同的變換方法,而H.264中對(duì)色度的DC分量又進(jìn)行了一次變換。

1.1.2.1 量化和反量化

    AVS-M和H.264使用了類似的量化方法,都是使用了查表、乘法和移位,而避免了除法。需要注意的是AVS-M中要對(duì)量度量化參數(shù)做一次映射來做為色度的量化參數(shù)。

g)變長(zhǎng)編碼

    AVS-M使用了基于上下文的多階哥侖布碼,而H.264有專門的CAVLC或CABAC編碼方式。需要注意的是在AVS-M中對(duì)幀內(nèi)預(yù)測(cè)增加了一種“直接”模式,即所有4x4塊都使用預(yù)測(cè)模式。所以我們?cè)谧冮L(zhǎng)編碼時(shí),要先判斷“直接”模式是否出現(xiàn),然后再進(jìn)行相應(yīng)的處理。

h)環(huán)路濾波

    AVS-M和H.264中都有環(huán)路濾波,這可以顯著減少塊效應(yīng),提高視覺質(zhì)量。它們的具體實(shí)現(xiàn)是不同的,總體來說AVS-M要比H.264簡(jiǎn)化。

i)調(diào)試

    在調(diào)試過程中,我們使用了比較法。就是從編碼器端將每幀的預(yù)測(cè)值和殘差存到一個(gè)文件中,然后使用標(biāo)準(zhǔn)的解碼器進(jìn)行解碼,并在解碼的同時(shí)比較預(yù)測(cè)值和殘差,然后確定出錯(cuò)的宏塊,進(jìn)行調(diào)試。這樣通過比較編碼器端的重建圖像和解碼器端的輸出圖像,從而保證的編碼器的正確性。

優(yōu)化

    視頻編碼需要消耗大量的計(jì)算資源,如果不針對(duì)特殊平臺(tái)進(jìn)行優(yōu)化就很難滿足實(shí)時(shí)編碼的要求。本項(xiàng)目采用的硬件平臺(tái)是Intel的Xeon系列,它具有MMX,SSE,SSE2等加速指令集。x264本身已經(jīng)針對(duì)MMX和SSE指令集進(jìn)行了優(yōu)化,鑒于AVS-M與H.264的相似性,針對(duì)H.264的優(yōu)化策略應(yīng)該多數(shù)多能應(yīng)用于AVS-M標(biāo)準(zhǔn)上。因?yàn)樵谙嗤妮斎胂聝?yōu)化和不優(yōu)化的編碼器所產(chǎn)生的碼流應(yīng)該二進(jìn)制相等,因此在開發(fā)過程中采用了在相同輸入的前提下,比較不優(yōu)化與優(yōu)化兩個(gè)版本輸出的碼流是否是二進(jìn)制相等,以確定的那些優(yōu)化模塊是AVS-M與H.264能共用的。

    具體比較時(shí)采用二分法以加快比較的速度——先屏蔽一半的優(yōu)化模塊,然后比較開啟優(yōu)化模塊與關(guān)閉優(yōu)化模塊時(shí)產(chǎn)生的碼流是否相等,如果相等則當(dāng)前開啟的優(yōu)化模塊為AVS-M與H.264能共用的,如果不等則縮小范圍繼續(xù)比較,直道能確定每一個(gè)優(yōu)化模塊。經(jīng)過上述比較之后,最終確定只有四個(gè)優(yōu)化模塊二者不能共用,其他的模塊兩者都能共用,其中兩個(gè)不能共用的模塊可以通過修改C代碼解決,另兩個(gè)需要修改MMX/SSE匯編代碼。

測(cè)試

    對(duì)音視頻的編解碼效果的對(duì)比分析主要基于兩個(gè)方面——客觀指標(biāo)和主觀感受。當(dāng)前,已經(jīng)有不少針對(duì)AVS-M與H.264的基于客觀指標(biāo)(PSNR)的對(duì)比測(cè)試了,本文沒有必要再次重復(fù)進(jìn)行這些測(cè)試,本文將就二者在實(shí)時(shí)編碼條件下的觀眾主觀感受進(jìn)行對(duì)比測(cè)試。測(cè)試主要以觀眾在觀看經(jīng)過實(shí)時(shí)編碼處理后的音視頻時(shí)是否能感覺到有明顯的失真現(xiàn)象為依據(jù)??疾旆炙膫€(gè)方面,即視頻的清晰程度和連貫程度及音頻的清晰程度和連貫程度,每個(gè)方面根據(jù)觀眾的實(shí)際感受進(jìn)行評(píng)分,評(píng)分的標(biāo)準(zhǔn)如下表所示:

    對(duì)比測(cè)試的環(huán)境設(shè)置為視頻幀率25,固定碼率控制模式、關(guān)閉loopfilter功能、GOP為15、H.264采用baseline級(jí);音頻采樣率為48000、雙聲道、AAC HE編碼格式、碼率52kbps。測(cè)試的結(jié)果記錄如下表所示(其中四個(gè)字母依次代表“視頻清晰程度”、“視頻連貫程度”、“音頻清晰程度”和“音頻連貫程度”)

本文小結(jié)

    比較測(cè)試的結(jié)果數(shù)據(jù),可以看出AVS-M在低碼率(32~512Kbps)、低分辨率(SQCIF~CIF)的條件下有接近H.264的性能表現(xiàn),但總體上落后與H.264標(biāo)準(zhǔn)??紤]到移動(dòng)終端有限的計(jì)算能力和AVS-M相對(duì)于H.264有計(jì)算復(fù)雜度上的優(yōu)勢(shì),我們可以確信在未來的移動(dòng)通信領(lǐng)域AVS-M應(yīng)該能占有一席之地。

參考文獻(xiàn)

[1]周大山,李華,張淑芳等。AVS-M視頻解碼器設(shè)計(jì)和實(shí)現(xiàn). 電視技術(shù),2005,8:10-11
[2]信息技術(shù)先進(jìn)音/視頻編碼:視頻[S].中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn).GB/T20090.2-2006,2006
[3]高文,王強(qiáng),馬思偉. AVS數(shù)字音視頻編解碼標(biāo)準(zhǔn)。中興通訊技術(shù),2006,6:6-9

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉