當(dāng)前位置:首頁 > 公眾號精選 > 程序員小哈
[導(dǎo)讀]LD3320是非特定人(不用針對指定人)語音識別芯片,即語音聲控芯片。最多可以識別50條預(yù)先內(nèi)置的指令。 工作模式: LD3320(LDV7)語音模塊可以工作在以下三種模式:普通模式:直接說話,模塊直接識別;按鍵模式:按鍵觸發(fā)開始ASR進(jìn)程;口令模式:需要一級喚

LD3320是非特定人(不用針對指定人)語音識別芯片,即語音聲控芯片。最多可以識別50條預(yù)先內(nèi)置的指令。

工作模式:

LD3320(LDV7)語音模塊可以工作在以下三種模式:普通模式:直接說話,模塊直接識別;按鍵模式:按鍵觸發(fā)開始ASR進(jìn)程;口令模式:需要一級喚醒詞(口令);推薦使用口令模式,這樣避免嘈雜環(huán)境下誤動作。

應(yīng)用場景:

  • 家居智能控制

  • 智能小車DIY設(shè)計

  • 畢業(yè)設(shè)計創(chuàng)新功能

  • 個人DIY設(shè)計

  • 語音控制嵌入式產(chǎn)品設(shè)計

我購買的LDV7語音識別模塊,內(nèi)置單片機(jī),LD3320語音識別芯片的驅(qū)動是靠模塊上自帶的STC11L08單片機(jī)驅(qū)動的,我們可以修改模塊自帶工程的Demo程序,修改里面的關(guān)鍵詞,然后將識別的結(jié)果通過串口打印出來,我們使用另外一個MCU與該模塊進(jìn)行串口通信,解析收到的串口指令,進(jìn)而做響應(yīng)的指令動作。

例如

我們說口令:當(dāng)前時間(dang qian shi jian)
》》 模塊識別之后,串口輸出:PrintCom("{\"VoiceCommandCode\":2}");
》》 MCU接收串口信息之后,對該串口指令進(jìn)行解析(可以使用cJSON解析此字符串);
》》 然后通過TTS文字轉(zhuǎn)語音模塊播放當(dāng)前時間,即完成本次語音識別控制過程。

識別原理:

就是你說一句話,然后模塊用拼音去和你的發(fā)音做比較,在關(guān)鍵詞中找出哪些預(yù)設(shè)值的詞語與發(fā)音的接近程度大于多少的(假定50%),然后再從一堆大于(50% )里面輸出一個最接近的。

這里就會造成一個問題,容易造成誤識別太多。
如果你只有一個關(guān)鍵詞:時間
然后你說了一句:‘時刻’,他識別到‘時’這個發(fā)音,所以有50% 以上的相似,但是候選詞中沒有‘時刻’這個比他更接近的關(guān)鍵詞,所以他就會輸出‘時間’的結(jié)果。這樣子他就是錯誤了。
如果你設(shè)置一些擬聲詞,有可能隨隨便便就觸發(fā)了。

解決方案:

在設(shè)定好要識別的關(guān)鍵詞語后,為了進(jìn)一步降低誤識別率,可以再添加一些其他的任意詞匯進(jìn)識別列表,用來吸收錯誤識別,從而達(dá)到降低誤識別率的目的。我們把這樣一些關(guān)鍵詞語稱之為“垃圾關(guān)鍵詞語”。

比如,某個應(yīng)用場景中,需要識別的關(guān)鍵詞語是 4 條,“前進(jìn)”,“后 退”,“開門”,“關(guān)門”。在把這 4 個關(guān)鍵詞語設(shè)置進(jìn) LD3320 后,可以再另外設(shè)置10~30個詞語進(jìn)LD3320,比如“前門”,“后門”,“阿阿阿”,“嗚 嗚”等等。所以最好把一些擬聲詞或者容易混淆的詞語設(shè)置為垃圾關(guān)鍵詞,即,識別后不進(jìn)行輸出。
只有識別結(jié)果是 4 個關(guān)鍵詞語之內(nèi)的,才認(rèn)為識別有效。如果識別結(jié)果是 “垃圾關(guān)鍵詞語”,則說明是其他的聲音導(dǎo)致的誤識別,產(chǎn)品應(yīng)該重新開始一 次識別過程。這樣,可以非常有效地降低誤識別率。極大地提高終端用戶的主觀使用體驗。

移植過程:

1、向LD模塊中添加關(guān)鍵詞

2、用戶執(zhí)行函數(shù)User_handle(nAsrRes); 處理語音識別結(jié)果

3、根據(jù)不同結(jié)果,串口打印不同的指令

PrintCom("{\"VoiceCommandCode\":1}");

4、MCU根據(jù)指令不同,執(zhí)行不同的動作

以JSON格式發(fā)送數(shù)據(jù)至串口,與語音識別模塊相連的MCU接收此結(jié)果,然后對此字符串進(jìn)行解析,進(jìn)而得到當(dāng)前識別的命令是什么,進(jìn)而做相應(yīng)的動作。

   
  1. //LD3320

  2. if(USART5_RX_STA&0x8000)

  3. {

  4. uart5Len=USART5_RX_STA&0x3f; //得到此次接收到的數(shù)據(jù)長度


  5. receive_json = cJSON_Parse(USART5_RX_BUF); //創(chuàng)建JSON解析對象,返回JSON格式是否正確

  6. if (!receive_json)

  7. {

  8. printf("JSON格式錯誤:%s \r\n", cJSON_GetErrorPtr()); //輸出json格式錯誤信息

  9. }

  10. else

  11. {

  12. printf("JSON格式正確:%s \r\n",cJSON_Print(receive_json) );

  13. item_obj = receive_json->child; //獲取name鍵對應(yīng)的值的信息


  14. while(item_obj)

  15. {

  16. char * string = item_obj->string;


  17. if(!strcmp(string,"VoiceCommandCode"))

  18. {

  19. if(item_obj->valueint==0)

  20. {

  21. printf("收到一級口令 智能報時 ... \r\n");

  22. }

  23. else if(item_obj->valueint==1)

  24. {

  25. printf("“現(xiàn)在幾點(diǎn)了”命令識別成功 \r\n");


  26. m_nCurrentVoicePlayTimes++;

  27. while(U5152_BSY){}

  28. if(m_nCurrentVoicePlayTimes%2==0)

  29. {

  30. sprintf((char*)dtbuf,"[v5][s5][m3]當(dāng)前時間為%02d時%02d分%02d秒 \r\n",NowHour,NowMinute,NowSecond);

  31. }

  32. else

  33. {

  34. sprintf((char*)dtbuf,"[v5][s5][m51]當(dāng)前時間為%02d時%02d分%02d秒 \r\n",NowHour,NowMinute,NowSecond);

  35. }

  36. printf((char*)dtbuf);

  37. XFS_FrameInfo((char*)dtbuf) ;

  38. delay_ms(10);while(U5152_BSY){delay_ms(500);printf("while(U5152_BSY) \r\n");}

  39. }

  40. }


  41. item_obj = item_obj->next;


  42. printf("while(item_obj) \r\n");

  43. }


  44. }


  45. cJSON_Delete(receive_json);


  46. USART5_RX_STA=0;

  47. memset(USART5_RX_BUF, 0, sizeof(USART5_RX_BUF)); //清空數(shù)組

  48. }

LDV7模塊固件下載:

1、打開編譯后的.hex文件

2、選對串口號,芯片型號后,選擇“下載/編程”按鈕,然后給STC單片機(jī)上電或者復(fù)位。

3、發(fā)出語音,測試語音識別結(jié)果

然后其他與LDV7模塊相連的MCU只要解析接收到的串口數(shù)據(jù)即可。



喜歡請關(guān)注微信公眾號:程序員小哈
有啥想玩的模塊,留言給我,咱們一起玩
如果有其他的問題可以評論區(qū)指出,有問必答,知無不言。


免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點(diǎn),不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉