當(dāng)前位置:首頁(yè) > 工業(yè)控制 > 工業(yè)控制
[導(dǎo)讀]摘要:文章將口令識(shí)別與無(wú)線通信、機(jī)器人控制相結(jié)合,實(shí)現(xiàn)了基于口令識(shí)別的智能車(chē)無(wú)線控制系統(tǒng)。該系統(tǒng)包含接收和識(shí)別口令的主機(jī),發(fā)送指令和接收指令的通信模塊以及帶有特定功能的智能車(chē)。主機(jī)識(shí)別口令后,以無(wú)線傳

摘要:文章將口令識(shí)別與無(wú)線通信、機(jī)器人控制相結(jié)合,實(shí)現(xiàn)了基于口令識(shí)別的智能車(chē)無(wú)線控制系統(tǒng)。該系統(tǒng)包含接收和識(shí)別口令的主機(jī),發(fā)送指令和接收指令的通信模塊以及帶有特定功能的智能車(chē)。主機(jī)識(shí)別口令后,以無(wú)線傳送方式將指令發(fā)送給智能車(chē),智能車(chē)按指令實(shí)現(xiàn)相應(yīng)功能。主機(jī)和智能車(chē)都基于嵌入式系統(tǒng)。主機(jī)硬件電路由三星S3C6410處理器和外圍電路組成,口令識(shí)別部分采用連續(xù)隱馬爾科夫模型算法。實(shí)驗(yàn)表明,該系統(tǒng)有良好的穩(wěn)定性和實(shí)用性。
關(guān)鍵詞:口令識(shí)別;無(wú)線通信;連續(xù)隱馬爾科夫模型

0 引言
   
語(yǔ)音是人類(lèi)交流信息最自然、最方便、最有效的方法。用語(yǔ)音與機(jī)器交互是人類(lèi)一直夢(mèng)寐以求的事情。經(jīng)過(guò)十幾年的發(fā)展,基于隱馬爾科夫模型的語(yǔ)音識(shí)別已經(jīng)達(dá)到了應(yīng)用要求。通過(guò)語(yǔ)音口令識(shí)別完成與機(jī)器交流變得順其自然。人們與機(jī)器交流,大多是為了控制機(jī)器運(yùn)作或獲取其運(yùn)行狀態(tài)。目前應(yīng)用廣泛的總線控制系統(tǒng),網(wǎng)絡(luò)控制系統(tǒng)大多要求有數(shù)據(jù)線傳送指令。無(wú)線通信技術(shù)讓這種控制擺脫了地域的束縛。通過(guò)語(yǔ)音口令識(shí)別,機(jī)器“聽(tīng)懂”語(yǔ)音并將其“翻譯”成指令,然后通過(guò)無(wú)線通信傳輸指令、控制遠(yuǎn)程智能車(chē)模式有著很好的應(yīng)用前景。基于口令識(shí)別的控制系統(tǒng)與嵌入式系統(tǒng)有效結(jié)合,與未使用嵌入式系統(tǒng)比較更有便捷易用,顯示出其優(yōu)勢(shì)作用?;诳诹钭R(shí)別的無(wú)線控制嵌入式系統(tǒng)在可廣泛應(yīng)用于偵查、自動(dòng)化控制領(lǐng)域。
    本文給出基于口令識(shí)別的智能車(chē)無(wú)線控制的嵌入式系統(tǒng)。該系統(tǒng)首先獲取語(yǔ)音口令并識(shí)別。識(shí)別口令完成后,解析成便于無(wú)線傳輸?shù)目刂浦噶顜?。控制指令幀通過(guò)無(wú)線網(wǎng)絡(luò)被傳輸?shù)竭h(yuǎn)程智能車(chē)。這種模式與單一的口令識(shí)別控制系統(tǒng)或無(wú)線控制系統(tǒng)相比,更有應(yīng)用價(jià)值和實(shí)際意義。整個(gè)系統(tǒng)有三個(gè)模塊,即主機(jī)模塊、通信模塊和智能車(chē)模塊。主機(jī)實(shí)現(xiàn)語(yǔ)音信號(hào)采集和口令識(shí)別。主機(jī)是以S3C6410為核心的嵌入式系統(tǒng),運(yùn)行廣泛應(yīng)用的WinCE6.0操作系統(tǒng)。通信模塊負(fù)責(zé)主機(jī)與智能車(chē)之間的通信。通信模塊基于ZigBee設(shè)計(jì),用TI公司CC2530F256芯片作為主芯片。智能車(chē)是基于51單片機(jī)控制的嵌入式系統(tǒng),會(huì)根據(jù)主機(jī)指令運(yùn)行。
    本文以下內(nèi)容分安排如下,第二節(jié)詳細(xì)介紹了系統(tǒng)要求和系統(tǒng)硬件結(jié)構(gòu),主要包括主機(jī)板、智能車(chē)板的硬件設(shè)計(jì),ZigBee通信模塊設(shè)計(jì)。第三節(jié)詳細(xì)介紹系統(tǒng)軟件設(shè)計(jì),主要包括口令識(shí)別算法設(shè)計(jì),主機(jī)軟件設(shè)計(jì),無(wú)線數(shù)據(jù)發(fā)送方法,智能車(chē)程序設(shè)計(jì)以及通信設(shè)計(jì)。第四節(jié)給出實(shí)驗(yàn)結(jié)果以及總結(jié)。

1 系統(tǒng)硬件設(shè)計(jì)
   
對(duì)于一個(gè)基于口令識(shí)別的無(wú)線控制系統(tǒng),主要有以下幾個(gè)要求。
    (1)完成語(yǔ)音口令識(shí)別功能,系統(tǒng)需要對(duì)人發(fā)出的口令迅速做出識(shí)別并實(shí)現(xiàn)。
    (2)為了更快地響應(yīng)用戶口令,系統(tǒng)要有滿足迅速反應(yīng)的硬件和優(yōu)化的算法,使得口令識(shí)別快捷穩(wěn)定。
    (3)通信模塊要具有安全性,使得傳送的指令保密又能安全到達(dá)對(duì)方。
    在主機(jī)中使用穩(wěn)定的嵌入式WINCE 6.0操作系統(tǒng)。通信模塊使用基于IEEE802.15.4標(biāo)準(zhǔn)的局域網(wǎng)協(xié)議Zigbee.ZigBee是一種便宜的,可加密,低功耗的近距離無(wú)線組網(wǎng)通訊技術(shù)。
    本文中,主機(jī)嵌入式系統(tǒng)是以ARM11芯片三星公司S3C6410作為主處理器。系統(tǒng)集成了256M DDR RAM,NAND Flash 2GB存儲(chǔ)器。S3C6410處理器主頻為533Mhz,最高可達(dá)667Mhz,具有低功耗、高性能等特點(diǎn)。主處理器通過(guò)支持AC97標(biāo)準(zhǔn)的WM9714音頻芯片接受音頻輸入。該芯片由ADC/DAC,話筒混頻器,可編程增益放大器(PGA)和鎖相環(huán)組成。還提供PCM/I2C接口和AC'97接口。
    本系統(tǒng)硬件框圖如圖1所示:


    通信模塊有發(fā)射端和接收端。發(fā)射端在主機(jī)中,通過(guò)主機(jī)的串口與其連接。接收端在智能車(chē)中,也通過(guò)串口和智能車(chē)控制器連接。發(fā)射端和接收端都由TI公司CC2530F256芯片作為核心加擴(kuò)展的外圍模塊組成。CC2530系列芯片是TI公司為嵌入式系統(tǒng)低功耗無(wú)線通信提供的解決方案。該系列芯片花費(fèi)很小的代價(jià)可以建立健壯的一對(duì)多、多對(duì)多的網(wǎng)絡(luò)。
    智能車(chē)上有以51單片機(jī)為核心的控制電路板。89S51單片機(jī)主要接受和解析接收端的指令、控制電機(jī)、反饋狀態(tài)等。系統(tǒng)的硬件性能滿足需求的計(jì)算要求和安全性要求。

2 系統(tǒng)軟件設(shè)計(jì)
2.1 算法設(shè)計(jì)
   
口令識(shí)別系統(tǒng)框架如圖2所示


    口令識(shí)別系統(tǒng)包括預(yù)處理,參數(shù)提取,口令訓(xùn)練和口令識(shí)別模塊。預(yù)處理包括端點(diǎn)檢測(cè),分幀和加窗。另外,預(yù)處理部分對(duì)于高頻信號(hào)部分進(jìn)行加重處理,便于后續(xù)階段信號(hào)參數(shù)提取。參數(shù)提取模塊從語(yǔ)音信號(hào)中提取最能反映語(yǔ)音信息的語(yǔ)音特征,然后通過(guò)這些特征參數(shù)組成特征參數(shù)矢量序列,供后面處理??诹钣?xùn)練模塊是通過(guò)大量口令特征參數(shù)訓(xùn)練口令模板。口令識(shí)別模塊是將口令特征參數(shù)與口令模板匹配,得出識(shí)別結(jié)果。
2.2 軟件設(shè)計(jì)
   
軟件設(shè)計(jì)分為兩個(gè)方面。主機(jī)方面,口令識(shí)別和指令發(fā)送在Microsoft公司的嵌入式操作系統(tǒng)Windows CE 6.0上開(kāi)發(fā)。開(kāi)發(fā)工具為官方推薦的Visual Studio 2005。有好的交互界面對(duì)于應(yīng)用程序來(lái)說(shuō)是很有必要的,控制軟件開(kāi)發(fā)使用了MFC圖形界面。在智能車(chē)方面,是用著名的Keil開(kāi)發(fā)工具開(kāi)發(fā)了代碼,完成了接受指令和電機(jī)的驅(qū)動(dòng)。
2.2.1 主機(jī)程序
   
主機(jī)主要工作有口令識(shí)別、發(fā)送指令兩部分。在系統(tǒng)上,為這兩部分開(kāi)兩個(gè)進(jìn)程。主機(jī)程序流程圖如下:


    主機(jī)程序兩個(gè)進(jìn)程分別負(fù)責(zé)口令識(shí)別和口令發(fā)送。口令識(shí)別進(jìn)程口令識(shí)別過(guò)程中對(duì)語(yǔ)音信號(hào)提取MFCC特征參數(shù)。用隱馬爾科夫模型對(duì)口令建模、訓(xùn)練和識(shí)別。對(duì)每條語(yǔ)音口令信號(hào),先切除靜音,進(jìn)行預(yù)加重處理,然后通過(guò)Hamming窗分幀。幀長(zhǎng)和幀移分別為20ms和10ms,對(duì)每一幀語(yǔ)音信號(hào)提取12階MFCC和△MFCC-共24維參數(shù)作為特征矢量。
2.2.2 指令發(fā)送方法
   
主機(jī)的另一個(gè)任務(wù)是指令發(fā)送。發(fā)送指令通過(guò)單獨(dú)進(jìn)程控制。該進(jìn)程工作主要有:
    (1)首先調(diào)用Windows CE API函數(shù)CreateFile()打開(kāi)串口。主機(jī)以獨(dú)占的方式打開(kāi)串口2。
    (2)之后通過(guò)調(diào)用API函數(shù)SetCommState()來(lái)設(shè)定串口波特率。主機(jī)設(shè)置串口波特率9600,數(shù)據(jù)位8位,停止位1位,無(wú)奇偶校驗(yàn)。
    (3)通過(guò)調(diào)用write()函數(shù)來(lái)寫(xiě)需要串口發(fā)送的指令。通過(guò)read()函數(shù)來(lái)讀取串口發(fā)送過(guò)來(lái)的數(shù)據(jù)。
    (4)程序結(jié)束后,調(diào)用CloseHandle()函數(shù)來(lái)關(guān)閉串口。
    以上口令識(shí)別算法和指令發(fā)送已進(jìn)行多次優(yōu)化,滿足系統(tǒng)對(duì)算法的要求。
2.2.3 智能車(chē)程序
   
智能車(chē)部分主要任務(wù)為接受指令和控制電機(jī)。
    程序從main函數(shù)開(kāi)始后,首先初始化單片機(jī)內(nèi)部寄存、配置串口、電機(jī)復(fù)位等。之后就等待串口數(shù)據(jù)的輸入。該過(guò)程是一個(gè)接受指令、解析指令、執(zhí)行指令、讀取車(chē)狀態(tài)、發(fā)送狀態(tài)的一個(gè)循環(huán)。接受指令是單片機(jī)通過(guò)串口接受無(wú)線模塊發(fā)送過(guò)來(lái)的指令數(shù)據(jù)。解析指令是指根據(jù)設(shè)定的協(xié)議,單片機(jī)判斷指令數(shù)據(jù)完整性并提取關(guān)鍵數(shù)據(jù)。執(zhí)行指令是指單片機(jī)根據(jù)關(guān)鍵數(shù)據(jù)執(zhí)行相應(yīng)代碼,例如:向前走、停止、左轉(zhuǎn)等。讀取車(chē)狀態(tài)是指單片機(jī)讀取車(chē)上溫度傳感器的數(shù)據(jù)。發(fā)送狀態(tài)是指小車(chē)打包狀態(tài)數(shù)據(jù)并發(fā)送的過(guò)程。
2.3 通信設(shè)計(jì)
   
通信設(shè)計(jì)主要是通信協(xié)議的設(shè)計(jì)。作為應(yīng)用在嵌入式系統(tǒng)中的通信協(xié)議,應(yīng)該滿足完整性、便捷性等。本文設(shè)計(jì)的通信幀結(jié)構(gòu)如圖4所示。


    傳輸?shù)膸衅邆€(gè)字節(jié)組成,其中開(kāi)頭和結(jié)尾兩個(gè)字節(jié)是幀頭和幀尾。第二第三字節(jié)是目標(biāo)地址,第四第五字節(jié)是數(shù)據(jù)。第六字節(jié)是校驗(yàn)位。在傳輸過(guò)程中發(fā)生的一些小錯(cuò)誤。通過(guò)接受的幀的校驗(yàn)位來(lái)排除,有一定的抗干擾性。

3 實(shí)驗(yàn)與總結(jié)
3.1 實(shí)驗(yàn)結(jié)果
   
本文中取常用口令“前進(jìn)”,“后退”,“左轉(zhuǎn)”等8個(gè)單詞為一組,進(jìn)行實(shí)驗(yàn)。共設(shè)置三組實(shí)驗(yàn)。第一組試驗(yàn)中,測(cè)試系統(tǒng)口令識(shí)別的準(zhǔn)確率,分別用說(shuō)話者A,B,C,D四個(gè)人進(jìn)行以上口令識(shí)別,實(shí)驗(yàn)結(jié)果中系統(tǒng)識(shí)別率達(dá)到了90%。第二組試驗(yàn)中,測(cè)試無(wú)線系統(tǒng)的傳輸距離。本文將無(wú)線模塊接收端和客戶端相分離,至到接收端無(wú)法接受到發(fā)送端的數(shù)據(jù)位置。實(shí)驗(yàn)結(jié)果是傳送數(shù)據(jù)可以穿過(guò)一面墻,傳輸距離可到達(dá)30m。第三組實(shí)驗(yàn)為綜合測(cè)試,即應(yīng)用測(cè)試。試驗(yàn)中,測(cè)試者可以很方便的控制智能車(chē)運(yùn)動(dòng)和狀態(tài)。
3.2 總結(jié)
   
口令識(shí)別的應(yīng)用使人對(duì)機(jī)器人控制更加方便。本文在廣泛應(yīng)用的WinCE嵌入式平臺(tái)上實(shí)現(xiàn)了智能車(chē)無(wú)線控制系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,口令識(shí)別率達(dá)到了90%。在主機(jī)正確識(shí)別的口令中,智能車(chē)的誤操作概率為零。與之前孤立的口令識(shí)別系統(tǒng)或控制系統(tǒng)相比,本系統(tǒng)首先應(yīng)用方便,口令識(shí)別準(zhǔn)確率高。其次,接口模塊化,通過(guò)改變無(wú)線數(shù)據(jù)傳送方式可以增加多個(gè)節(jié)點(diǎn)控制,便于管理?;诳诹钭R(shí)別的無(wú)線控制系統(tǒng)具有很好的便捷性和擴(kuò)展性。尤其是基于嵌入式的該系統(tǒng),具有很廣泛的應(yīng)用前景。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉