語音識別系統(tǒng)的單片機控制
隨著信息技術的飛速發(fā)展,人們尋求一種更為直接的人機對話方式,聲控電腦就是再此基礎上發(fā)展起來的。聲控電腦使用語音識別技術,而語音識別是目前一種熱門技術。電腦語音識別系統(tǒng),可以用聲音直接控制電腦工作,是人機接口中最具有人性化的方式。
1 聲控電腦原理
聲控電腦是由人的聲音發(fā)出指令來控制電腦工作的,可是電腦本身不能識別人的聲音,因此必須讓電腦先了解熟悉人講話的聲音及腔調來建立參考樣本,將原先訓練好的聲音特色保存為語音參考樣本存入電腦。原理流程如圖1所示。
(1)語音訓練將輸入的語音經過分析保存為特征參數(shù)參考樣本,即告訴電腦將來要識別哪些聲音。?
(2)語音識別將輸入的語音經過分析與原先電腦內的參考樣本做對比,找出最相近的聲音作為識別效果。?
2 語音識別DSP組成及控制?
(1)組成?
DSP語音識別芯片;數(shù)字/模擬轉換電路;語音提示語ROM;參數(shù)存儲SRAM。
數(shù)字/模擬轉換電路是將語音模擬信號轉換成數(shù)字信號,交DSP芯片做分析處理,然后將其存儲在SRAM中。如果要說出所講的聲音,同樣是經過數(shù)字/模擬轉換電路將其轉換為模擬信號,經驅動電路,可以將聲音還原。?
(2)控制?
SETUSER選取某一使用者(最多支持8人)。?
GETSTATVS取回主控CPU狀態(tài)值。?
TRAIN語音參考樣本輸入。?
RECOG語音識別對比。?
SAVESTATVS存儲主控CPU狀態(tài)值。?
COMPARE識別對比找出最相近的一組樣本。?
3 聲控系統(tǒng)硬件電路?
將20PIN排針插座,連接至8051單片機控制板上,DSP和8051的信號傳輸都由此總線來完成。8051用于主控系統(tǒng),主要做聲控系統(tǒng)的人機接口處理,所用到的接口包括鍵盤及LCD信息顯示,并以8051單片機來控制DSP芯片用于語音識別。如果將RS232與PC機連接,便可以將信息傳回PC而顯示在屏幕上。除可以顯示信息外,還可以做程序設計時修改錯誤,在系統(tǒng)開發(fā)時相當有用。系統(tǒng)組成原理如圖2所示。
4 軟件設計
系統(tǒng)軟件由主控程序、通信模塊、DSP處理模塊等組成。其中主控程序完成系統(tǒng)初始化、通信命令處理、顯示信息等功能。
通信模塊由通信子程序、通信接收中斷、通信發(fā)送中斷組成,主要實現(xiàn)與PC機的通信。DSP模塊由DSP模塊子程序、語音識別對比程序、取,存主控CPU狀態(tài)值程序、選取使用者程序組成,是語音識別最主要的環(huán)節(jié)。程序結構如圖3所示。
5 結語
本系統(tǒng)采用DSP控制芯片,使硬件成本降低,可以獨立操作,不必靠個人電腦來做語音識別的控制,最主要的是其語音識別效果佳且穩(wěn)定。
參考文獻
[1]張輝.Motorola單片機應用技術[M].北京:北京航空航天大學出版社,1999
[2]陳龍三.8051單片機C語言控制與應用[M].北京:清華大學出版社,1999