當(dāng)前位置:首頁 > 嵌入式 > 嵌入式軟件
[導(dǎo)讀]基于SMP8654的MKV播放器設(shè)計與實現(xiàn)

摘要:MKV封裝格式是一種新的由開源組織制定的多媒體封裝格式,具有可擴展,支持多種視頻和音頻編碼格式等優(yōu)點,是高清影片采用的主要封裝格式之一。本文基于SMP8654平臺設(shè)計與實現(xiàn)了一個MKV播放器,能夠支持對高清MKV文件的播放,并針對嵌入式系統(tǒng)和高清媒體的特點做了進一步優(yōu)化,具有一定的工程意義和市場價值。
關(guān)鍵詞:MKV;多媒體封裝;SMP8654;播放器;嵌入式系統(tǒng)

0 引言
    隨著電子技術(shù)和多媒體技術(shù)的進步,數(shù)字視頻的分辨率逐步提高,開始由SD(標(biāo)準(zhǔn)清晰度)向HD(高清晰度)演變。伴隨著大屏幕液晶顯示技術(shù)的發(fā)展,高清影片開始逐步進入到廣大消費者的視野。高清播放機由于支持眾多的視頻和音頻編碼格式,能夠流暢播放1080i/p清晰度的高清影片,并且在輸出方面支持模擬、數(shù)字、HDMI等多種方式。此外在價格和片源方面相對于藍光播放機有很大優(yōu)勢,將逐步替代VCD、DVD等傳統(tǒng)播放器,成為下一代家庭影音娛樂的主流產(chǎn)品。
    MKV是一種新的多媒體封裝格式,支持多種視頻和音頻編碼格式,能夠?qū)⒍噙_16路不同格式的音頻和不同語言的字幕流封裝到一個文件中,在高清影片中得到了廣泛的應(yīng)用,越來越多的視頻和影片采用MKV作為其封裝格式。能否支持MKV封裝格式是高清播放機性能的一個重
要指標(biāo)。本文提出了一種基于SMP8654平臺的MKV播放器設(shè)計與實現(xiàn)方案,并針對嵌入式系統(tǒng)和高清媒體的特點做了進一步優(yōu)化,能夠提供對MKV文件的流暢播放。

1 MKV封裝格式
    MKV全稱為Matroska Video,是一種新的多媒體封裝格式。多媒體封裝格式也稱多媒體容器(Multimedia Container),它不同于H264、MPEG-2、MPEG-4這類編碼格式,它只是為多媒體編碼提供了一個“外殼”,本身不涉及編碼。MKV是由開源組織Matroska Development Team制定的一個標(biāo)準(zhǔn),總共包括三部分:MKV(Matroska Video)、MKA(Matroska Audio)和MKS(Matroska Subtitles),后兩種格式分別針對音頻和字幕,應(yīng)用較少。MKV的目的是代替AVI等傳統(tǒng)封裝格式。AVI是Microsoft于1992年推出一種封裝格式。其含義是Audio Video Interactive,就是把視頻和音頻編碼混合在一起儲存。微軟在1996年推出了AVI的改進版本AVl2.0。AVI格式上限制比較多,只能有一個視頻軌道和一個音頻軌道,還可以有一些附加軌道,如文字等。AVI格式不提供任何控制功能??傮w而言,AVI為主的傳統(tǒng)封裝格式結(jié)構(gòu)陳舊,只能包含少數(shù)幾種音視頻格式,并且不夠開放,可擴展性差。正因為如此,才促成了Matroska這類新的多媒體封裝格式的誕生。
    MKV相對于傳統(tǒng)的封裝格式,有如下優(yōu)點:支持可變比特率(VBR),支持錯誤檢測以及修復(fù)軟字幕,支持流式傳輸,強大的開放性和跨平臺兼容性,支持16路以上的音頻流和字幕流等。Matroska最大的特點是能容納幾乎所有類型的視頻、音頻及字幕流,除H.264以外,也可包括MPEG4、MPEG2、Ac3、AAC等其他視頻和音頻格式,即使是非常封閉的RealMedia及QuicklTime也被它包括進去了,并將它們的音視頻進行了重新組織來達到更好的效果。
    由于MKV封裝格式本身具有眾多優(yōu)點,隨著互聯(lián)網(wǎng)和高清影片的流行,MKV格式得到了廣泛的應(yīng)用,互聯(lián)網(wǎng)上越來越多的高清影片采用MKV格式。然而,MKV是一個由開源組織制定和推廣的標(biāo)準(zhǔn),缺乏大商業(yè)公司的支持,導(dǎo)致MKV文件的播放缺乏一個完整和有效的設(shè)計實現(xiàn)。在性能和資源受限的嵌入式平臺上,這個問題尤為嚴(yán)重。雖然目前有很多高清播放機都提供了對MKV格式的支持,但是大部分實現(xiàn)方案都存在支持不完善、播放效率比較低的問題,播放高碼率的影片時會出現(xiàn)不流暢、畫面卡頓等問題,影響觀看效果。本文提出了一種基于SMP8654平臺的MKV播放器的設(shè)計與實現(xiàn)方案,并針對嵌入式系統(tǒng)的特點做了優(yōu)化,較好地達到了MKV文件流暢播放的要求。

2 硬件平臺和軟件總體設(shè)計
    硬件平臺以SMP8654芯片為核心,通過總線與RAM、SATA硬盤、Flash閃存、輸入輸出設(shè)備等外設(shè)相連。SMP8654是Sigma Design公司推出的多媒體播放SoC解決方案,集成了一個強大的多媒體處理器、強健的內(nèi)容保障系統(tǒng)、新的DDR2內(nèi)存控制器、多個片上CPU以及完備的系統(tǒng)外圍設(shè)備接口。從媒體播放角度看,smp8654提供了一個完整支持高清晰度視頻解碼的先進解碼引擎,能夠支持對MPEGl、MPEG-2、MPEG-4、H.264、WMV9、VCl以及AVS等格式的硬件解碼,支持高效能的圖形加速,支持多標(biāo)準(zhǔn)音頻解碼和先進的顯示處理能力。Siena Design公司為方便第三方廠商開發(fā)應(yīng)用,提供了與芯片相關(guān)的開發(fā)工具包和開發(fā)框架。本文的工作也基于這個框架進行二次開發(fā)。軟件平臺方面,由于一個完善的播放系統(tǒng)已經(jīng)相當(dāng)復(fù)雜,不適合直接操縱底層硬件來完成功能,需要操作系統(tǒng)的支持。本項目中操作系統(tǒng)采用uclinux,文件系統(tǒng)采用Romfs。uclinux是專為嵌入式系統(tǒng)定制的一款Linux,它具有標(biāo)準(zhǔn)Linux操作系統(tǒng)的穩(wěn)定性、強大網(wǎng)絡(luò)功能等主要優(yōu)點,但是卻不像標(biāo)準(zhǔn)Li-nux那樣復(fù)雜,主要針對沒有MMU(內(nèi)存管理單元)的微控制器。Romfs是一款專門為嵌入式系統(tǒng)設(shè)計的文件系統(tǒng),體積小、可靠性好、讀取速度快,是嵌入式系統(tǒng)常用的文件系統(tǒng)。

[!--empirenews.page--]
    媒體文件的播放流程一般包括如下幾個步驟:系統(tǒng)初始化、判斷文件類型、文件解析、設(shè)置硬件解碼器和音視頻解碼,其中文件解析和音視頻解碼是關(guān)鍵部分。由于SMP8654集成了完善的音視頻硬件解碼器,解碼工作主要由硬件完成,我們只需將音視頻數(shù)據(jù)按要求送入相應(yīng)的解碼緩沖區(qū)即可。整體的軟件架構(gòu)如圖2所示。

 

3 系統(tǒng)關(guān)鍵技術(shù)設(shè)計和實現(xiàn)
3.1 MKV文件解析
    MKV文件解析主要是對MKV格式的各個組成元素進行解析,以獲得必需的音視頻參數(shù)和媒體數(shù)據(jù)。MKV作為一種封裝格式,實際的視頻和音頻數(shù)據(jù)都被封裝到某一個子模塊中,要想獲得實際的數(shù)據(jù),必須首先對文件進行解析,并且文件解析貫穿播放的全過程。能否有效并正確的解析,關(guān)系到讀取數(shù)據(jù)的準(zhǔn)確性,進而影響播放的效果。MKV格式采用可變長編碼,能夠減少存儲空間,另一方面,也給解析帶來了新問題。
MKV文件格式建立在EBML(Extensible Binary MetaLanguagel基礎(chǔ)上,EBML是一種類似于XML格式的可擴展二進制元語言,使用可變長度的整數(shù)存儲,以節(jié)省空間。EBML的基本結(jié)構(gòu)是典型的TLV結(jié)構(gòu),有三部分組成:

    ID標(biāo)志屬性類型,size為后面data部分的大小,data部分為ID所標(biāo)識屬性的實際數(shù)據(jù),ID和size均為可變長編碼的整數(shù)。整數(shù)的長度為length=1+[number of leading zero bits]。前面的零的個數(shù)最多為7個,即最多能表示56個比特的整數(shù)。文件中不允許出現(xiàn)大于56比特的數(shù)。

[!--empirenews.page--]
    MKV文件格式的顯著特點是模塊化、結(jié)構(gòu)化存儲。每一個高一級的元素由若干次一級的元素組成,直至最基本的組成元素,每個元素都是一個TLV結(jié)構(gòu)。一個標(biāo)準(zhǔn)的MKV文件有兩部分組成:EBML Header和Segment。EBML Header由EBMLVersion、DocType等子元素組成,包含了文件的版本、文檔類型等相關(guān)信息。Segment部分保存了媒體文件的視頻和音頻的實際數(shù)據(jù),其data部分又可以分為SeekHead、Tracks、Cluster等若干子元素(表1)。所有元素的處理都可以按照一個統(tǒng)一的流程來進行。我們可以仿照TCP/IP協(xié)議分層的思想,對每一層的每個功能都用一個函數(shù)來完成,使用更底層的函數(shù)完成此項功能,并可被更高層的函數(shù)調(diào)用。文件解析時,從文件頂層開始,每當(dāng)上一級的元素解析到有某個子元素時,調(diào)用此函數(shù)進行次一級的解析,依次直至文件結(jié)束,即可完成對文件的解析處理。整個MKV的解析調(diào)用過程如圖3所示。Hea-der Parse和Segment Parse為文件最上層的元素解析函數(shù),Cluster Parse、Tracks_Parse等為次一級組成元素的解析函數(shù)。ebml_read_ele-ment_idebml read element length為最底層基本組成元素的解析函數(shù)。


3.2 設(shè)置硬件解碼器音視頻核心參數(shù)
    Tracks用來描述文件中包含的每一路多媒體流的信息。一路多媒體流用一個TrackEntry描述,所有的track都要在一個Tracks中進行描述。一個TrackEntry主要包含:TrackNumber(判定屬于哪一路流的ID)、TrackType(video、audio或者subtitle)、TimeScale(時間戳單位)、CodecID(編碼格式);CodecPrivate(不同的編碼格式所需的私有數(shù)據(jù))等;對于視頻,還包含以下信息:PixelWidth、PixelHeight等。對于音頻,track還包含以下信息:channels、Sampling Frequency等。這些是關(guān)于音視頻能否正確解碼播放的關(guān)鍵參數(shù),需要在解析時獲得,然后通過硬件操縱函數(shù)設(shè)置。
    Cluster包含實際的數(shù)據(jù),一個Cluster塊,通常是幾秒鐘時間跨度的媒體數(shù)據(jù),一個文件有數(shù)以千計的Cluster。每個Cluster又有若干個BlockGroup。根據(jù)Cluster和BlockGroup的起始pts和持續(xù)時間,可以計算出當(dāng)前Block的實際pts。PTS是用來確定播放時間的重要數(shù)據(jù),也是音視頻同步的關(guān)鍵信息。這部分信息要在送入視頻或音頻數(shù)據(jù)的同時設(shè)置硬件解碼器。
3.3 性能優(yōu)化
    MKV封裝的影片通常為高清影片,分辨率在1920×1080,即使采用H.264等先進編碼格式,碼率依然非常高。同時,MKV支持可變碼率,可變碼率能夠減少文件的體積,但是劇烈波動的碼率會使播放不能流暢進行。在高清文件中碼率一般在10~30M/ps之間,最高可達60Mp/  s,如此高的碼率,如果不做特殊處理,播放時很容易出現(xiàn)卡頓,播放不流暢等問題。為解決這個問題,我們從兩方面考慮。
    在解析方面,解析的效率關(guān)系到能否盡快將數(shù)據(jù)讀入緩沖區(qū),如果處理時間過長,造成一段時間內(nèi)緩沖區(qū)為空,這時候就會出現(xiàn)卡頓。  MKV文件中通常包含一路視頻、多路音頻和多路字幕,播放時只選中其中一路音頻和一路字幕,其他路的數(shù)據(jù)可以被視為無效數(shù)據(jù)。在解析時,可以根據(jù)Block頭的標(biāo)記判斷出這路數(shù)據(jù)是當(dāng)前播放需要的有效數(shù)據(jù)還是無效數(shù)據(jù)。如果是有效數(shù)據(jù),則繼續(xù)解析,并將音視頻數(shù)據(jù)送入緩沖區(qū),如果是無效數(shù)據(jù),不進行解析,直接移動文件指針到下一個Block,這樣可大大加快文件解析和數(shù)據(jù)讀取速度。
   在播放方面,通常播放時的處理流程是讀取一幀數(shù)據(jù),然后送入硬件解碼器,等到收到硬件解碼器為空的信號,再讀取下一幀的數(shù)據(jù)。如果是處理低碼率文件的播放,這樣做不會有問題,但是當(dāng)文件分辨率比較高,碼率比較高時,解析讀取時問和解碼時間都會增加,這樣做就會造成卡頓。為解決這個問題,我們在內(nèi)存中設(shè)計了一個緩沖FIFO,相當(dāng)于一個滑動窗口(圖4),緩沖區(qū)可以存放若干個幀(一幀就是一個Block,根據(jù)幀的大小緩沖區(qū)存放的個數(shù)不等)。當(dāng)緩沖區(qū)未滿時,讀取文件中的一個Block并解析,然后將實際數(shù)據(jù)到緩沖區(qū)的隊尾。當(dāng)發(fā)現(xiàn)
硬件緩沖區(qū)空閑時,將FIFO隊首的數(shù)據(jù)從內(nèi)存直接送入硬件緩沖區(qū),不需要再去讀取文件。由于緩沖區(qū)中有多個幀,能夠提供一定的緩沖,這樣在碼率波動時就仍然能夠及時提供數(shù)據(jù),避免出現(xiàn)硬件緩沖區(qū)為空造成的卡頓,播放不流暢等問題。

 

4 結(jié)語
    本文詳細介紹了MKV封裝格式的特點。并基于SMP8654提出了一種MKV播放器的設(shè)計與實現(xiàn)方案,經(jīng)驗證,能夠達到對高清MKV文件的流暢播放,并已經(jīng)實際應(yīng)用到產(chǎn)品上。接下來將做進一步研究,在MKV播放器的基礎(chǔ)上,設(shè)計一種針對多種封裝格式的通用媒體播放器框架,將FLV、FLAC等其他格式也融合進來,并提供較好的可擴展性,方便后續(xù)擴充其他的封裝格式。
 

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉