當前位置:首頁 > 工業(yè)控制 > 工業(yè)控制
[導讀]摘要:語音控制機器已經成為人機界面設計的一種重要手段。LD3320作為一款語音識別專用芯片,集成了語音識別處理器和一些外部電路,實現(xiàn)了有限詞匯的非特定人語音識別。文章介紹了LD3320芯片的基本功能、電路設計以及

摘要:語音控制機器已經成為人機界面設計的一種重要手段。LD3320作為一款語音識別專用芯片,集成了語音識別處理器和一些外部電路,實現(xiàn)了有限詞匯的非特定人語音識別。文章介紹了LD3320芯片的基本功能、電路設計以及控制軟件的編寫。
關鍵詞:語音識別;集成電路;LD3320

0 引言
    語音不僅是人與人之間進行信息交流最直接、最方便和最有效的工具,也是人與機器之間進行通信的重要工具。過去的二三十年中,圖形用戶界面(Graphical User Interface,GUI)作為人與機器的通信接口取得了很大的進展,但使用GUI仍然擺脫不了手的操作,某些場合仍有不便。因此,語音用戶界面(Voice User Interface,VUI)成為人們的下一個目標,人們希望通過聲音可以對機器發(fā)出指令。
    語音識別有著非常廣泛的應用領域,例如智能家電、智能家居、智能導航、智能玩具等等,這些領域下,語音識別提高了設備的易用性。另外,在某些場合,操作者需要用手控制其它設備,比如駕駛員駕駛過程中,或者非常強調響應時間,比如軍事訓練種情況的緊急處置,這些場合不允許操作者進行復雜的操作,語音控制就成為一項必要的選擇。
    語音識別屬于數(shù)字信號處理的研究領域,其算法初期是依靠計算機、數(shù)字信號處理器等來實現(xiàn)的,但隨著微電子學和集成電路技術的新進展,近年來不斷有語音識別集成電路投放市場。其中,ICRoute的LD3320就是一款性價比較高的芯片。

1 LD3320芯片介紹
    LD3320是一顆基于非特定人語音識別(SI-ASR,Speaker Independent Automatic Speech Recognition)技術的語音識別/聲控芯片。該芯片集成了語音識別處理器和一些外部電路,包括ADC、DAC、麥克風接口、聲音輸出接口等。該芯片不需要外接任何的輔助芯片如Flash、RAM等,直接集成在現(xiàn)有的產品中,即可以實現(xiàn)語音識別/聲控/人機對話功能。
    LD3320完成非特定人語音識別,每次識別最多可以設置50項候選識別句,每個識別句可以是單字、詞組或短句,長度為不超過10個漢字或者79個字節(jié)的拼音串。另一方面,識別句內容可以動態(tài)編輯修改,因此可由一個系統(tǒng)支持多種場景。


    芯片采用48腳QFN塑料封裝,工作供電為3.3V。芯片內部電路的簡要邏輯圖如圖1所示。其核心是語音以別運算器,配合輸入、輸出、AD/DA轉換等模塊,完成語音識別的功能。LD3320還支持并行和串行接口,串行方式可以簡化與其他模塊的連接。

2 LD3320的應用電路設計
    LD3320的基本應用電路由一個微控制器(MCU)和LD3320組成。電路中的主控MCU芯片,是為了完成對LD3320芯片寄存器的操作。
    對LD3320芯片的各種操作,都必須通過寄存器的操作來完成。比如設置標志位:讀取狀態(tài);向FIFO寫入數(shù)據(jù);識別完成后獲得識別結果等。例如在編輯關鍵詞語時,主控MCU通過把關鍵詞語的拼音串設置進LD3320相關寄存器來完成編輯。
    其寄存器大體可以分為以下幾類,F(xiàn)IFO數(shù)據(jù)緩存器、語音識別控制寄存器、音量調節(jié)、模擬電路和其它的輔助寄存器。寄存器讀寫操作有2種方式,即標準并行方式和串行SPI方式。LD3320寄存器的地址空間為8位,編號從00H到FFH,可參考文獻。
    本文選用的主控MCU是51內核的單片機STC10L08XE。演示的軟件程序全部燒錄在MCU的內置Flash中。主控MCU直接控制LD33203完成所有和語音識別相關的工作。
    電源設計可以使用NS公司的LM1117-3.3芯片,為LD3320提供3.3V的電壓:音頻輸入和輸出,可以使用柱極體MIC和0.5W的小喇叭;語音識別完成后,為了實現(xiàn)對后續(xù)電路的驅動,可以利用MCU的串行口與其它模塊進行連接。


    主控MCU與LD3320的連接關系如圖2所示,MCU的P0端口的8根線和LD3320并行方式連接,控制線也分別連接。此外還連接了復位信號和中斷信號。對LD3320來說,復位信號(RSTB)由MCU發(fā)出,而中斷信號由LD3320發(fā)出,MCU負責接收。
    另外,還有一些輔助電路,比如麥克風的偏置、喇叭音量的控制,以及電源的去耦等,這里不作詳細介紹。

3 LD3320的軟件編程
3.1 編程模式
    主控MCU通過讀/寫LD3320的寄存器完成操作。用戶有兩種編程模式:“中斷模式”和“輪詢模式”。
    所謂中斷模式,就是系統(tǒng)的主控MCU在接收到外界一個觸發(fā)后(比如用戶按動某個按鍵),啟動LD3320芯片的一個定時識別過程(比如5s),要求用戶在這個定時過程中說出要識別的語音關鍵詞語。過了這個過程后,需要用戶再次觸發(fā)才能再次啟動一個識別過程。
    所謂輪詢模式,就是系統(tǒng)的主控MCU反復啟動識別過程。如果沒有人說話沒有識別結果,則每次識別過程的定時到時后再啟動一個識別過程;如果有識別結果,則根據(jù)識別作相應處理后(比如播放某個聲音作為回答)再啟動一個識別過程。
3.2 程序流程
    語音識別的操作流程是:
    (1)語音識別用初始化(包括通用初始化)。在此步驟中,對各寄存器進行初始化設置。
    (2)寫入識別列表。LD3320是一個基于詞庫的語音識別芯片,在此步驟中,應將待識別的短語寫入識別列表。列表的規(guī)則是,每個識別條目對應一個特定的編號(1個字節(jié)),不同的識別條目的編號可以相同,而且不用連續(xù),但是數(shù)值要小于256(00H~FFH)。
    (3)開始識別,并準備好中斷響應函數(shù),打開中斷允許位。
    (4)響應中斷。如果麥克風采集到聲音,不管是否以別出正常結果,都會產生一個中斷信號。而中斷程序要根據(jù)寄存器的值分析結果。讀取BA寄存器的值,可以知道有幾個候選答案,而C5寄存器里的答案是得分最高、最可能正確的答案。
    如果不用中斷方式,也可以通過查詢方式工作。在“開始識別”后,讀取寄存器B2H的值,如果為21H就表示有識別結果產生。在此之后讀取候選項等操作與中斷方式相同。
    LD3320芯片還具有MP3播放的功能,在這里不再進行介紹。

4 結論
    LD3320的功能是完成有限詞組的非特定人語音識別,我們將其應用在一個虛擬環(huán)境下戰(zhàn)術訓練課題中。戰(zhàn)術訓練中,常常需要下達一些短口令,而在我們所設計的訓練環(huán)境中,如果口令采用鍵盤或鼠標的方式進行輸入,顯然有違設計的初衷。所以,我們使用LD3320設計VUI控制電路,用語音識別的方式,將獲得的識別結果再轉換成串口信號,輸入計算機,達到語音控制的目的。
    實踐證明,這種方式可以滿足語音控制的要求,但是語音識別的速度,即實時性還有待改進。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉