基于DSP的實(shí)時(shí)數(shù)據(jù)無損壓縮實(shí)現(xiàn)方案

時(shí)間：2018-09-27 15:20:01

關(guān)鍵字： DSP 實(shí)時(shí)數(shù)據(jù) 嵌入式處理器無損壓縮

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 數(shù)據(jù)壓縮技術(shù)能減少傳輸所用的時(shí)間和存儲(chǔ)空間，在有限的信道容量內(nèi)傳輸更多的有用信息，有助于降低功率和帶寬要求，改善通信效率。反之，如果不進(jìn)行數(shù)據(jù)壓縮，則無論傳輸或存儲(chǔ)都很難實(shí)用化。

數(shù)據(jù)壓縮技術(shù)能減少傳輸所用的時(shí)間和存儲(chǔ)空間，在有限的信道容量內(nèi)傳輸更多的有用信息，有助于降低功率和帶寬要求，改善通信效率。反之，如果不進(jìn)行數(shù)據(jù)壓縮，則無論傳輸或存儲(chǔ)都很難實(shí)用化[1]。

1 硬件及實(shí)現(xiàn)原理

結(jié)合本設(shè)計(jì)的實(shí)際情況，由于壓縮算法比較復(fù)雜，計(jì)算量大，在壓縮數(shù)據(jù)時(shí)必須采用浮點(diǎn)型運(yùn)算。另一方面，由于處理精度要求高，所以需要選擇浮點(diǎn)型DSP?；谏鲜隹紤]，選用TI公司的一款性價(jià)比非常高的浮點(diǎn)芯片TMS320C6713。其主頻225MHz，每周期執(zhí)行8條32bit指令，最高定點(diǎn)運(yùn)算能力為 1800MIPS，浮點(diǎn)運(yùn)算能力為1350MFLOPS，32位指令集，而且內(nèi)部自帶256KB的RAM，4KB程序緩沖器和4KB的數(shù)據(jù)緩沖器，可以通過外部存儲(chǔ)器接口EMIF(External Memory Inter Faces)擴(kuò)展SDRAM和Flash[2]。在本設(shè)計(jì)中，對原始數(shù)據(jù)按照每2 048B為一組進(jìn)行壓縮。壓縮的最小單位是2 048B，且壓縮率不固定，對于某組特定數(shù)據(jù)壓縮后可能比原來的數(shù)據(jù)還要大。壓縮前后的數(shù)據(jù)都需要放到DSP的RAM中進(jìn)行處理，其256KB的RAM不能滿足本設(shè)計(jì)存儲(chǔ)要求，需要通過EMIF擴(kuò)展存儲(chǔ)空間。SDRAM選用Micron公司的MT48LC2M32B2。其數(shù)據(jù)總線為32位，存儲(chǔ)空間為 64Mbit。工作電壓為3.3V，內(nèi)部流水線結(jié)構(gòu)保證了芯片的高速運(yùn)行。SDRAM可以與EMIF無縫接口。EMIF的CE0連入片選引腳CS，將 SDRAM映射到CE0地址空間（0x80000000－0x80800000）。Flash是系統(tǒng)在斷電后用來保存程序和初始化數(shù)據(jù)的存儲(chǔ)器，系統(tǒng)上電時(shí)，由引導(dǎo)程序?qū)SP的應(yīng)用程序從該存儲(chǔ)器引導(dǎo)到系統(tǒng)的高速存儲(chǔ)器RAM中。本設(shè)計(jì)用AMD公司生產(chǎn)的1M×8bit/512K×16bit AM29LV800-70 Flash存儲(chǔ)器，其數(shù)據(jù)寬度為8位、16位可選，采用3.3V供電，訪問時(shí)間僅70ns。EMIF的CE1連入片選引腳CE，將Flash映射到CE1 地址空間地址范圍為0x90000000～0x90100000，尋址空間為1MB[3]。

通常在高速數(shù)據(jù)采集系統(tǒng)中，數(shù)據(jù)處理速度及數(shù)據(jù)傳輸速度與前端A/D轉(zhuǎn)換器的采集速度不一致。為了協(xié)調(diào)它們之間工作，可以加入數(shù)據(jù)存儲(chǔ)器或者數(shù)據(jù)緩存器（FIFO）進(jìn)行數(shù)據(jù)緩沖，使得前端數(shù)據(jù)采集和后級數(shù)據(jù)處理能夠協(xié)調(diào)工作。在本設(shè)計(jì)中，前端的采樣速度為27Kb/s；且數(shù)據(jù)流是連續(xù)的。DSP的主頻為 225MHz，經(jīng)過鎖向環(huán)分頻后其讀取數(shù)據(jù)的速度為38Mb/s左右。DSP若一直等待讀數(shù)據(jù)，會(huì)大大降低其數(shù)據(jù)的處理能力。DSP讀入數(shù)據(jù)后，馬上對數(shù)據(jù)進(jìn)行壓縮，壓縮后把相應(yīng)的數(shù)據(jù)寫到輸出FIFO。同理，發(fā)送模塊的處理速度為18Kb/s。DSP寫輸出FIFO的速度也在38Mb/s左右。顯然，前端與DSP及DSP與發(fā)送模塊的處理速度不是一個(gè)數(shù)量級。所以在前端與DSP之間，DSP與發(fā)送模塊間分別加了兩個(gè)FIFO。本設(shè)計(jì)中FIFO1、 FIFO2均選用IDT72V19160，其存儲(chǔ)空間為128KB，16位并行數(shù)據(jù)總線，可達(dá)到100MHz的操作時(shí)鐘。原理框圖如圖1所示。

前端通過16位數(shù)據(jù)總線將數(shù)據(jù)寫入到輸入FIFO1中。在程序中通過控制其半滿（HF）信號(hào)，即當(dāng)數(shù)據(jù)超過32KB時(shí)（32768+1）， HF信號(hào)低電平有效，就會(huì)觸發(fā)一次中斷通知可編程邏輯和DSP，DSP進(jìn)入中斷后把2KB的數(shù)據(jù)從輸入FIFO1中讀入到SBUF所指向的SDRAM空間中，在進(jìn)行高速壓縮以后，被壓縮的數(shù)據(jù)放到DBUF中。SBUF的數(shù)據(jù)要與DBUF的數(shù)據(jù)進(jìn)行比較，若DBUF中存儲(chǔ)數(shù)據(jù)的容量小于SBUF中的存儲(chǔ)數(shù)據(jù)的容量，就把DBUF中相應(yīng)的數(shù)據(jù)寫到DSP的軟FIFO中，否則，就把SBUF中相應(yīng)的數(shù)據(jù)寫到DSP的軟FIFO中。最終，DSP把壓縮后的數(shù)據(jù)通過其軟FIFO寫入到輸出FIFO2中，等待發(fā)送模塊把數(shù)據(jù)讀走。

在上述過程中，如果DSP沒有等待到中斷信號(hào)，則返回繼續(xù)等待，直到檢測到中斷信號(hào)，才讀取FIFO1中的數(shù)據(jù)。在DSP對SBUF中的數(shù)據(jù)幀壓縮的同時(shí)，前端以固定的采樣率對模擬信號(hào)進(jìn)行采樣，并寫入到輸入FIFO1中。同時(shí)DSP把壓縮后的數(shù)據(jù)按每次小于2KB左右的速度寫入到輸出FIFO2。當(dāng)輸出FIFO2半滿，發(fā)送模塊控制器會(huì)把其HF信號(hào)通過GPIO口指向DSP。本設(shè)計(jì)中用GP10實(shí)現(xiàn)相應(yīng)的操作。DSP的GPIO口可以設(shè)為輸入引腳，在中斷向量表中定義后，其本身可以當(dāng)作中斷使用。這樣DSP可以把采集到的實(shí)時(shí)數(shù)據(jù)源源不斷地寫入到FIFO2。整個(gè)信號(hào)處理模塊的不同子模塊都處于并行工作狀態(tài)，較好地實(shí)現(xiàn)了數(shù)據(jù)的實(shí)時(shí)壓縮，提高了壓縮效率。

設(shè)備上電DSP復(fù)位后，由其內(nèi)部固化的自引導(dǎo)程序(BOOT)將存于Flash存儲(chǔ)器的程序和數(shù)據(jù)搬移至內(nèi)部 RAM中，然后DSP即可以開始讀取壓縮算法的應(yīng)用程序，繼續(xù)運(yùn)行。DSP的工作流程圖如圖2所示。上電以后，首先初始化DSP的CSL函數(shù)庫，然后初始化PLL、GPIO及關(guān)中斷寄存器，等待中斷信號(hào)的來臨。

2 算法的選擇

無損壓縮就是對信源信息進(jìn)行壓縮編碼后在解壓縮時(shí)能夠完全恢復(fù)，也即在壓縮和解壓縮過程中對信源信息沒有絲毫損失。常用的無損壓縮方法有Shannon- Fano編碼、Huffman編碼、游程(Run-length)編碼、LZW(Lempel-Ziv-Welch)編碼和算術(shù)編碼(ARC)等。對許多信息而言，沒必要完全保留全部特征。在允許一定精度損失的情況下，可以獲得更高的壓縮編碼效率。這類壓縮編碼方法成為有損壓縮。本設(shè)計(jì)采用無損壓縮，不再討論有損壓縮。

無損數(shù)據(jù)壓縮算法可以分為統(tǒng)計(jì)方法和詞典編碼方法。統(tǒng)計(jì)方法當(dāng)以Huffman編碼和算術(shù)編碼(ARC)為代表。這種方法需要統(tǒng)計(jì)信源符號(hào)的概率分布情況，并根據(jù)統(tǒng)計(jì)結(jié)果產(chǎn)生壓縮碼。算術(shù)編碼是一種高效清除字串冗余的算法。仙儂信息論把字符aj出現(xiàn)的自信息量定義為I(aj)=-logpj I(aj)亦稱自信息函數(shù)，其含義實(shí)際是隨機(jī)變量X取值為aj時(shí)所攜帶信息的度量。自信息量的概率平均值，即隨機(jī)變量I(aj) 的數(shù)學(xué)期望值，稱做信息熵或簡稱熵。算術(shù)編碼從全序列出發(fā)，采用遞推形式連續(xù)編碼。它不是將單個(gè)的信源符號(hào)映射成一個(gè)碼字，而是將整個(gè)輸入符號(hào)序列映射為實(shí)數(shù)軸上[0，1)區(qū)間內(nèi)的一個(gè)小區(qū)間，其長度等于該序列的概率，再在該小區(qū)間內(nèi)選擇一個(gè)有代表性的二進(jìn)制小數(shù)，而且是一個(gè)介于0和1之間的二進(jìn)制小數(shù)作為實(shí)際的編碼輸出，從而達(dá)到了高效編碼的目的。例如算術(shù)編碼對某條信息的輸出為1010001111，它表示小數(shù)0.1010001111，也即十進(jìn)制數(shù) 0.64。不論是否為二元信源，也不論數(shù)據(jù)的概率分布如何，其平均碼長均能逼近信源的熵。算術(shù)編碼的過程實(shí)際上也就是信源編碼試圖將任意的信息流與0、1 之間的間隔建立一一對應(yīng)關(guān)系的過程。這樣要表示的信息流越長，則表示它的間隔就越小，用于表示這一間隔所需的二進(jìn)制位就越多。

算術(shù)編碼在編碼前要求預(yù)先統(tǒng)計(jì)各信源符號(hào)概率，但無須排序，只要編、解碼端使用相同的符號(hào)順序即可。建立合理的信源概率模型是進(jìn)行算術(shù)編碼的關(guān)鍵。信源概率模型的建立方法一般有兩種：一種是自適應(yīng)的模型，是在不斷輸入信源的過程中對信源符號(hào)出現(xiàn)的概率進(jìn)行統(tǒng)計(jì)，模型是在編碼過程中逐步建立起來并不斷更新；另一種是事先統(tǒng)計(jì)的模型，是在編碼前就對所有輸入信源符號(hào)的出現(xiàn)頻率進(jìn)行事先統(tǒng)計(jì)，而編碼過程中模型不再改變?；趦煞N模型算法的不同之處：事先統(tǒng)計(jì)模型在編碼之前就己經(jīng)建立，編碼過程中不再更新，故壓縮效率與輸入字節(jié)數(shù)關(guān)系不大；而自適應(yīng)模型是在編碼過程中建立并不斷更新，當(dāng)輸入信源的數(shù)據(jù)量較大時(shí)，出現(xiàn)概率大的字符編碼位數(shù)較少的優(yōu)越性才能得以體現(xiàn)。在復(fù)雜度上，由于后者需要不斷對模型進(jìn)行更新，故運(yùn)算量較大。

詞典編碼方法則是基于數(shù)據(jù)中許多結(jié)構(gòu)頻繁重復(fù)再現(xiàn)這一事實(shí)，人們可以對相同符號(hào)串分配同一碼字、通過索引或者其他諸如此類的方法編碼。LZW算法可以在對數(shù)據(jù)統(tǒng)計(jì)特性一無所知的前提下，使壓縮率接近己知統(tǒng)計(jì)特性時(shí)所能夠達(dá)到的壓縮率，其運(yùn)算速度快。LZW算法壓縮的原理在于用字典中詞條的編碼代替被壓縮數(shù)據(jù)中的字符串。字典中的詞條越長越多，壓縮率就越高。所以加大字典的容量可以提高壓縮率。但從字典中查找詞條是算法中最費(fèi)時(shí)的工作，其字典的容量受到計(jì)算機(jī)內(nèi)存限制，且字典也存在被填滿的可能。當(dāng)字典不能再加入新詞條后，過老的字典就不能保證高的壓縮率。

不同的壓縮算法有不同的優(yōu)點(diǎn)和缺點(diǎn)，不同算法的復(fù)雜性對空間的要求及壓縮率也不同。壓縮算法不僅僅依賴于壓縮方法本身，也依賴于被壓縮文本的特點(diǎn)。在本文中，由于是對實(shí)時(shí)數(shù)據(jù)的壓縮，對壓縮過程的時(shí)間性能要求高，所以采用事先統(tǒng)計(jì)模型的ARC。實(shí)驗(yàn)證明，采用事先統(tǒng)計(jì)模型的ARC，其運(yùn)算速度與LZW算法速度相近。而ARC算法在壓縮速度和壓縮去除率上都優(yōu)于LZW算法。

3 實(shí)驗(yàn)與結(jié)果

在比較字典編碼LZW與算術(shù)編碼ARC時(shí)，從壓縮速度和壓縮去除率上進(jìn)行比較。前端以27Kb/s的速度實(shí)時(shí)采集8位的數(shù)據(jù)，數(shù)據(jù)壓縮后通過發(fā)送模塊以18Kb/s的速度數(shù)據(jù)傳到外界。對原始數(shù)據(jù)以2 048B作為分組長度考察其壓縮去除率及壓縮時(shí)間。

壓縮去除率＝(原始數(shù)據(jù)量－壓縮后數(shù)據(jù)量)/原始數(shù)據(jù)量

這是從空間角度衡量。實(shí)際上，對壓縮效率而言還必須關(guān)注其時(shí)間效率，本文采用“壓縮速度”的概念，定義如下：

壓縮速度＝原始數(shù)據(jù)量/壓縮所需要的時(shí)間以2 048B的數(shù)據(jù)分組進(jìn)行分析：

1)從壓縮速度方面：完成2 048B的某噪聲數(shù)據(jù)，ARC算法需要5.64ms來完成，而LZW算法需要6.6ms，可見ARC算法的壓縮速度比較快。

(2)從壓縮效率方面：將某數(shù)據(jù)按照2 048B的長度進(jìn)行分組并壓縮，從表1中可知ARC算法針對不同分組段的數(shù)據(jù)壓縮去除率恒定在78%左右，而LZW算法，在該分組段壓縮去除率僅為71%?？梢娫摱螖?shù)據(jù)ARC壓縮算法壓縮去除率比較高。

采用ARC算法后，通過大量的實(shí)驗(yàn)數(shù)據(jù)的平均壓縮去除率為79%，滿足系統(tǒng)所要求的數(shù)據(jù)壓縮去除率大于50%的要求。用ARC算法壓縮2 048B的數(shù)據(jù)需要5.64ms左右。數(shù)據(jù)不同，壓縮時(shí)間會(huì)有所不同。通過對控制軟件讀取的數(shù)據(jù)進(jìn)行解包、解壓，證明還原出來的數(shù)據(jù)與原始數(shù)據(jù)完全一致，實(shí)現(xiàn)了實(shí)時(shí)數(shù)據(jù)的無損壓縮。