當前位置:首頁 > 消費電子 > 消費電子
[導讀]該設計運用三星公司的S3C2440,結合ICRoute公司的高性能語音識別芯片LD3320,進行了語音識別系統(tǒng)的硬件和軟件設計。在嵌入式Linux操作系統(tǒng)下,運用多進程機制完成了對語音識

該設計運用三星公司的S3C2440,結合ICRoute公司的高性能語音識別芯片LD3320,進行了語音識別系統(tǒng)的硬件和軟件設計。在嵌入式Linux操作系統(tǒng)下,運用多進程機制完成了對語音識別芯片、超聲波測距和云臺的控制,并將語音識別技術應用于多角度超聲波測距系統(tǒng)中。通過測試,系統(tǒng)可以通過識別語音指令控制測量方向,無需手動干預,最后將測量結果通過語音播放出來。

1.引言

語言是人類傳播信息的重要手段,語音識別則是實現(xiàn)語音控制的關鍵技術。采用嵌入式語音識別技術使得設備具有功耗低、使用簡便、靈活等優(yōu)點,擺脫了復雜按鍵和按鈕的困擾,在服務機器人、智能家居及消費電子等領域發(fā)揮著重要作用。

2.系統(tǒng)構成與原理

語音識別主要包括兩個階段:訓練階段和識別階段。在訓練或識別過程中,都必須對輸入語音進行預處理和特征提取。訓練階段通過用戶輸入的若干次訓練語音,經(jīng)過預處理和特征提取后得到特征參數(shù),最后通過特征參數(shù)建模,進而建立訓練語音的參考模型庫。而識別階段是將輸入語音的特征矢量參數(shù)和參考模型庫中的參考模型進行相似性度量,然后把相似度最高的輸入特征矢量作為識別結果輸出,從而達到語音識別目的,如圖1所示。

 

 

語音識別技術可分為:特定人識別和非特定人識別兩種。特定人識別是指需要對待識別人的語音進行采集訓練,識別對象為專門的人;非特定人識別是指識別對象為大多數(shù)用戶,一般要采集多個人的語音進行錄音、訓練和學習,從而達到較高的識別率。

在實際應用中,現(xiàn)代技術開發(fā)嵌入式語音識別有兩種實現(xiàn)方式:調入嵌入式語音開發(fā)包和外擴語音識別芯片。本文的語音識別系統(tǒng)方案是以嵌入式處理器S3C2440為核心,外擴非特定人語音識別芯片LD3320,并將超聲波測距模塊和云臺相結合作為系統(tǒng)的機械執(zhí)行機構。系統(tǒng)測量過程如下:首先根據(jù)語音指令控制兩自由度云臺的位姿,使超聲波探測器指向特定方向,然后開啟超聲波探測器,測量出前方障礙物距離,最后將測量結果轉化為可以播放的二進制數(shù)據(jù)流,通過LD3320的播放功能完成數(shù)據(jù)的播放。

3.硬件電路設計方案

硬件電路主要包括語音識別部分、主控部分、超聲波測距部分和舵機控制部分,如圖2所示。處理器為三星公司的S3C2440,系統(tǒng)主頻最高可達533MHz,支持SPI、I2C、UART等接口,能夠滿足控制系統(tǒng)的需求。主控芯片S3C2440通過SPI總線完成對語音識別模塊的讀寫操作,超聲波測距部分和舵機控制部分由處理器的GPIO進行統(tǒng)一控制。

 

 

3.1語音識別電路設計

為了使系統(tǒng)能夠識別操作人員發(fā)出的語音指令,設計中采用了由ICRoute公司設計生產(chǎn)的非特定人語音識別芯片LD3320,它集成了語音識別處理電路和一些外部電路,包括AD、DA轉換器、麥克風接口、聲音輸出接口等,不需要外接任何的輔助芯片如Flash、RAM。在主控制器的控制下,可以識別出預先添加到識別列表中的內容。設計中參考了ICRoute發(fā)布的LD3320數(shù)據(jù)手冊,圖中LD3320的P0、P1、P2引腳通過SPI接口與嵌入式處理器相接,控制信號WRB、CSB、RSTB以及中斷返回信號引腳INTB與處理器S3C2440直接相連,如圖3所示。

 

 

3.2超聲波測距和舵機控制電路設計

超聲波測距原理相對比較成熟,系統(tǒng)中采用超聲波測距模塊HC-SR04。該模塊有兩個TTL電平通信引腳,兼容3.3V電平。其中,控制端口Trig發(fā)一個10us以上的高電平,接收端口Echo將輸出與距離成正比的高電平信號。當Echo有高電平輸出時就開啟處理器定時器,當端口電平跳變?yōu)榈碗娖綍r關閉定時器,根據(jù)定時器的值可計算得到障礙物的距離。其中,控制端口Trig和接收端口Echo分別接至處理器的GPG9、GPG6引腳。

超聲波測距模塊的感應角度小于15°,為了擴大測距的感應角度范圍,將超聲波測距模塊安裝在兩自由度云臺上,其中,舵機為SG90(9G),旋轉角度為180°。處理器通過GPB0和GPB1分別控制兩個舵機以實現(xiàn)云臺的旋轉,以測量不同方向的障礙物,如圖4所示。

 

 

4.軟件設計方案

系統(tǒng)軟件基于嵌入式Linux操作系統(tǒng),實現(xiàn)了語音識別、語音播放、超聲波測距和舵機控制等任務,使用fock機制為每項任務分配獨立的進程,使系統(tǒng)可以進行多任務處理。針對不同功能模塊編寫了相應的底層驅動程序,為上層應用程序提供了調用接口。

系統(tǒng)工作流程如下:處理器通過SPI總線對語音識別芯片LD3320進行通用初始化,使語音識別芯片進入循環(huán)識別模式,系統(tǒng)處理器反復啟動語音識別過程。如果有識別結果,則根據(jù)識別作相應處理后(比如播放某個聲音作為應答)再啟動下一個識別過程。處理器通過SPI總線讀取C5寄存器的識別結果并分析,將語音命令轉換為超聲波測距和舵機的控制信號,完成多方位測距任務,如圖5所示。

 

 

4.1語音識別功能程序設計

語音識別芯片LD3320的特色是兼有語音識別和MP3播放的兩項功能,在功能切換的時候,必須進行通用初始化,對芯片進行一系列的設置。

語音識別功能的驅動程序工作流程為通用初始化à語音識別用初始化→寫入識別列表→開始識別→響應識別中斷。為了提高識別成功率,在識別列表中增加了“垃圾關鍵詞”以吸收錯誤的識別。上層應用程序為語音識別功能分配了單獨的進程,通過ioctl()函數(shù)控制LD3320的工作狀態(tài),read()函數(shù)可以讀取識別結果。程序中使用select機制實現(xiàn)read()函數(shù)的非阻塞訪問。同時,設定select監(jiān)控超時時間,在超時后,重新初始化語音識別芯片LD3320,為下一次語音識別做準備,如圖6所示。

 

 

4.2語音播放功能程序設計

LD3320支持MP3數(shù)據(jù)播放,程序中操作順序為:通用初始化à播放模式初始化à音量調節(jié)à開始播放,并準備好中斷響應函數(shù),打開中斷允許位。在程序中,首先將數(shù)字0~9、“十”、“百”、“點”的語音MP3數(shù)據(jù)分別轉換為標準C語言數(shù)組格式文件,將該文件添加到工程中進行統(tǒng)一編譯。然后把需要播放的距離數(shù)據(jù)進行拆分,并對每一位進行查表操作,得到相應的語音數(shù)據(jù)。例如,將距離數(shù)據(jù)12.5拆分為:“1”、“十”、“2”、“點”、“5”。最后將查表得到的語音數(shù)據(jù)按從左到右的順序組合,并存儲到LD3320的播放數(shù)據(jù)存儲器,在即將播放完畢時,芯片會發(fā)出中斷請求,在中斷響應函數(shù)中連續(xù)寫入播放數(shù)據(jù),直到聲音數(shù)據(jù)播放完畢。

4.3超聲波測距和云臺控制程序設計

超聲波測距功能的驅動程序屬于Linux字符型驅動,利用ioctl()函數(shù)對相應GPIO進行時序控制,完成超聲波的發(fā)射和接收。在接收端口輸出高電平脈沖信號時,觸發(fā)系統(tǒng)中斷并使用定時器計算得到高電平持續(xù)時間△T,根據(jù)公式(1)完成距離S的測量。式中V為超聲波的傳播速度,常溫下超聲波在空氣中的傳播速度是340米/秒。在應用程序中,可以通過read()函數(shù)讀取到所測量的距離值。

S=VXΔT/2(1)

兩自由度云臺由兩個舵機組成,分別控制云臺水平和垂直方向的旋轉角度。在驅動程序中,首先打開定時器PWM功能并設置定時周期,然后映射定時器中斷函數(shù),最后使能定時器,使定時器開始運行。程序中根據(jù)實驗者發(fā)出的語音指令,利用ioctl()函數(shù)控制定時器輸出兩路PWM信號,分別控制兩個舵機的旋轉角度,最后將運動合成為云臺的位姿。

5.結語

本文介紹了嵌入式語音識別技術在超聲波測距系統(tǒng)中的一種應用以及實現(xiàn)方式,實驗人員可以通過預先定義好的語音指令(例如:“開始測量”、“左上方”、“前方”)實現(xiàn)對系統(tǒng)的控制,并利用超聲波進行距離測量。測量完成后,系統(tǒng)通過語音播放的方式將測量結果反饋給實驗人員,完成人機交互,提高了用戶體驗度。本系統(tǒng)具有易擴展的優(yōu)點,可以將其應用到其它嵌入式控制系統(tǒng)中。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉