當前位置:首頁 > 工業(yè)控制 > 工業(yè)控制
[導(dǎo)讀]本文介紹了一種適合家電遙控器應(yīng)用的新型DVD/TV學習式聲控遙控器。

摘  要:本文介紹了一種適合家電遙控器應(yīng)用的新型DVD/TV學習式聲控遙控器。它將語音識別技術(shù)應(yīng)用到遙控器中,使得遙控器能通過語音命令完成各種相應(yīng)的操作。該遙控器還能將其它遙控器發(fā)出的紅外線信號接收并存儲下來,從而實現(xiàn)其它遙控器所具有的操作命令。
關(guān)鍵詞:語音識別;學習式遙控器;非特定人

引言
    一般使用DVD播放器時要同時使用電視機來顯示所播放的圖像。因此必須同時使用DVD播放器的遙控器以及電視機的遙控器進行控制,使用很不方便。人們很希望用一個遙控器既可以控制DVD播放器又可以控制電視機。本文設(shè)計的遙控器就是一款DVD/TV并用的遙控器。DVD遙控器是定制的,其控制碼型是完全確定的。但是用戶所使用的電視機卻是各種類型的,其控制碼型也各式各樣,無法預(yù)先確定,因此對電視機的遙控器需采用學習式,即將電視機的控制碼通過學習過程送入遙控器。本遙控器就是一款學習式的,適應(yīng)各種類型電視機使用的遙控器。

    這款遙控器引用了語音辨識功能,既可以應(yīng)用按鍵控制也可以發(fā)語音命令進行控制,給人們帶來極大方便。

系統(tǒng)硬件設(shè)計
    系統(tǒng)主芯片采用清華大學與Infineon公司合作新推出的具有DSP和單片機(M8051)雙核的語音專用芯片UniSpeech。該芯片集成了12bit的ADC和11bit的DAC,省去了額外的CODEC器件。由于采用了SoC結(jié)構(gòu),構(gòu)成系統(tǒng)的芯片數(shù)量少,系統(tǒng)的集成度和穩(wěn)定性高。因此該芯片非常適合于開發(fā)帶有語音識別功能的遙控器等應(yīng)用。
紅外線信號的發(fā)射是通過MCU的功能引腳PWM驅(qū)動紅外線發(fā)射管實現(xiàn)的,由于PWM引腳具有脈沖寬度調(diào)制功能,只要設(shè)置相應(yīng)的寄存器,就能輸出具有一定占空比的載波信號,因此不需額外的驅(qū)動器件就可根據(jù)需要發(fā)出所要的紅外信號。紅外線的接收則是由紅外線接收管連接到MCU的通用輸入/輸出引腳實現(xiàn)。 

    考慮到語音聲學模型、遙控碼等所需要的存儲數(shù)據(jù)量比較大,本文采用了SST公司的8Mbits的Flash存儲器39VF080。

    遙控器設(shè)計中比較重要的一點是按鍵的功能設(shè)計,結(jié)合一般用戶使用DVD和TV遙控器的習慣,本設(shè)計只設(shè)置了較少的4×4的掃描式按鍵。只有最常用的幾個功能既可以按鍵控制,又可以語音控制,其它功能可以完全由語音控制實現(xiàn)。其系統(tǒng)硬件框圖如圖1所示。

    系統(tǒng)中 MCU作為主控制芯片,完成對各種接口的控制和系統(tǒng)的配置。DSP作為協(xié)處理器,完成語音識別算法和語音合成計算。通過MIC的輸入語音,經(jīng)過ADC的8kHz采樣、12bit的線性量化,然后送到DSP進行處理。

    由于系統(tǒng)語音識別部分是面向非特定人設(shè)計的,因此必須事先準備訓(xùn)練好的聲學模型和已經(jīng)編輯好的語音命令詞條。系統(tǒng)通過UART與計算機串口相接,將已經(jīng)編輯好的語音命令詞條和聲學模型存入Flash中??紤]到實際使用的需要,本文將各語音命令詞條(如“開機”、“關(guān)機”)對應(yīng)到一個按鍵所對應(yīng)的遙控碼上。這樣,當輸入不同的語音命令,通過語音識別得到與之匹配的指令,就可實現(xiàn)與對應(yīng)按鍵相同的控制效果。

系統(tǒng)軟件設(shè)計
    本系統(tǒng)軟件被設(shè)計為一個超循環(huán)(Super-Loops)結(jié)構(gòu)的實時系統(tǒng)。通過在主程序中構(gòu)造一個超循環(huán)把所有任務(wù)模塊鏈接起來。任務(wù)級的程序得到控制權(quán)后,首先檢查是否有事件需要處理。如果沒有就放棄控制權(quán),使得超循環(huán)任務(wù)鏈中的下一個任務(wù)得到控制。如果確實有事件需要處理,那么就完全或部分地處理該事件,然后就立刻交出控制權(quán)。通過這樣的協(xié)作,所有的任務(wù)每次執(zhí)行時都只占用系統(tǒng)很少的運行時間。系統(tǒng)流程如圖2所示。
代碼結(jié)構(gòu)如下:
void main(void)

 EA = 0;
// 屏蔽中斷 
 Init();
// 系統(tǒng)初始化
 EA = 1;
// 打開中斷
 while (1)
 {
 Drv_Ring(); //驅(qū)動層,負責掃描鍵盤和檢測是否有語音輸入
 App_Ring(); //應(yīng)用層,負責紅外線信號的發(fā)射和接收以及語音命令的識別
 }
}

    功能模塊之間的切換是通過一個功能開關(guān)和一個語音識別啟動鍵實現(xiàn)的,當功能開關(guān)置為“LEARN”學習功能時,系統(tǒng)進入學習功能;當置為“DVD”檔時,系統(tǒng)進入DVD功能;當置為“TV”檔時,系統(tǒng)則進入TV功能。

DVD功能模塊
    DVD遙控器的遙控碼已由DVD播放器生產(chǎn)廠商提供。為此,DVD遙控碼型將根據(jù)所屬廠家提供的信息直接在程序中確定,因此在按鍵發(fā)送紅外信號時,也是直接由程序確定對應(yīng)的碼型。通過PWM引腳發(fā)射。

TV功能模塊
    對TV功能而言,其遙控碼型必須通過學習過程取得,并存于數(shù)據(jù)Flash中。當用戶按鍵時,程序根據(jù)按鍵鍵值,從數(shù)據(jù)Flash中讀取對應(yīng)的遙控碼型,然后通過功能引腳PWM發(fā)送該遙控碼。

語音識別模塊
    當語音識別啟動鍵被按下時,系統(tǒng)進入識別狀態(tài),開始接收語音命令的輸入,識別完語音命令之后,根據(jù)識別結(jié)果發(fā)送相應(yīng)的遙控碼。語音識別子系統(tǒng)的基本結(jié)構(gòu)如圖3所示。

    語音識別引擎采用基于子詞的非特定人語音識別模型,與以往的基于孤立詞整詞的模型相比,具有靈活性高、穩(wěn)健性好的特點。

    按照各自的功能,大致上可以將識別算法分為三個部分:特征提取、模型參數(shù)訓(xùn)練和識別網(wǎng)絡(luò)解碼。對于一個基于子詞的非特定人嵌入式語音識別引擎而言,聲學模型(采用HMM)是與識別任務(wù)無關(guān)的,模型參數(shù)相對固定,因此模型參數(shù)訓(xùn)練的過程可以在PC平臺上完成(見圖3虛框部分),需要嵌入到片上的模塊只有特征提取和識別網(wǎng)絡(luò)解碼部分。特征提取選用了MFCC參數(shù)作為語音識別引擎的語音特征參數(shù),識別網(wǎng)絡(luò)解碼采用維特比(Viterbi)搜索算法。為了保證算法能夠達到較高的識別精度,而又占用較少的資源,采用兩級識別結(jié)構(gòu),在一顆專用芯片上達到了99%的識別精度。

學習模塊
    當系統(tǒng)處于學習功能狀態(tài)時,系統(tǒng)檢測紅外遙控碼。根據(jù)用戶所選按鍵,將接收到的紅外遙控信息存到該按鍵對應(yīng)的Flash數(shù)據(jù)區(qū)中。當下次按下該按鍵時,就可從該按鍵對應(yīng)的Flash數(shù)據(jù)區(qū)中取出新學習到的紅外遙控碼。
本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉