LD3320語音識別模塊：LDV7模塊使用詳解

時間：2020-09-08 23:26:47

關(guān)鍵字： LD3320 語音識別

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀]LD3320是非特定人（不用針對指定人）語音識別芯片，即語音聲控芯片。最多可以識別50條預(yù)先內(nèi)置的指令。工作模式： LD3320（LDV7）語音模塊可以工作在以下三種模式：普通模式：直接說話，模塊直接識別；按鍵模式：按鍵觸發(fā)開始ASR進(jìn)程；口令模式：需要一級喚

LD3320是非特定人（不用針對指定人）語音識別芯片，即語音聲控芯片。最多可以識別50條預(yù)先內(nèi)置的指令。

工作模式：

LD3320（LDV7）語音模塊可以工作在以下三種模式：普通模式：直接說話，模塊直接識別；按鍵模式：按鍵觸發(fā)開始ASR進(jìn)程；口令模式：需要一級喚醒詞（口令）；推薦使用口令模式，這樣避免嘈雜環(huán)境下誤動作。

應(yīng)用場景：

家居智能控制
智能小車DIY設(shè)計
畢業(yè)設(shè)計創(chuàng)新功能
個人DIY設(shè)計
語音控制嵌入式產(chǎn)品設(shè)計

我購買的LDV7語音識別模塊，內(nèi)置單片機(jī)，LD3320語音識別芯片的驅(qū)動是靠模塊上自帶的STC11L08單片機(jī)驅(qū)動的，我們可以修改模塊自帶工程的Demo程序，修改里面的關(guān)鍵詞，然后將識別的結(jié)果通過串口打印出來，我們使用另外一個MCU與該模塊進(jìn)行串口通信，解析收到的串口指令，進(jìn)而做響應(yīng)的指令動作。

例如

我們說口令：當(dāng)前時間（dang qian shi jian）
》》模塊識別之后，串口輸出：PrintCom("{\"VoiceCommandCode\":2}");
》》 MCU接收串口信息之后，對該串口指令進(jìn)行解析（可以使用cJSON解析此字符串）；
》》然后通過TTS文字轉(zhuǎn)語音模塊播放當(dāng)前時間，即完成本次語音識別控制過程。

識別原理：

就是你說一句話，然后模塊用拼音去和你的發(fā)音做比較，在關(guān)鍵詞中找出哪些預(yù)設(shè)值的詞語與發(fā)音的接近程度大于多少的（假定50%），然后再從一堆大于（50% ）里面輸出一個最接近的。

這里就會造成一個問題，容易造成誤識別太多。
如果你只有一個關(guān)鍵詞：時間
然后你說了一句：‘時刻’，他識別到‘時’這個發(fā)音，所以有50% 以上的相似，但是候選詞中沒有‘時刻’這個比他更接近的關(guān)鍵詞，所以他就會輸出‘時間’的結(jié)果。這樣子他就是錯誤了。
如果你設(shè)置一些擬聲詞，有可能隨隨便便就觸發(fā)了。

解決方案：

在設(shè)定好要識別的關(guān)鍵詞語后，為了進(jìn)一步降低誤識別率，可以再添加一些其他的任意詞匯進(jìn)識別列表，用來吸收錯誤識別，從而達(dá)到降低誤識別率的目的。我們把這樣一些關(guān)鍵詞語稱之為“垃圾關(guān)鍵詞語”。

比如，某個應(yīng)用場景中，需要識別的關(guān)鍵詞語是 4 條，“前進(jìn)”，“后退”，“開門”，“關(guān)門”。在把這 4 個關(guān)鍵詞語設(shè)置進(jìn) LD3320 后，可以再另外設(shè)置10~30個詞語進(jìn)LD3320，比如“前門”，“后門”，“阿阿阿”，“嗚嗚”等等。所以最好把一些擬聲詞或者容易混淆的詞語設(shè)置為垃圾關(guān)鍵詞，即，識別后不進(jìn)行輸出。
只有識別結(jié)果是 4 個關(guān)鍵詞語之內(nèi)的，才認(rèn)為識別有效。如果識別結(jié)果是 “垃圾關(guān)鍵詞語”，則說明是其他的聲音導(dǎo)致的誤識別，產(chǎn)品應(yīng)該重新開始一次識別過程。這樣，可以非常有效地降低誤識別率。極大地提高終端用戶的主觀使用體驗。

移植過程：

1、向LD模塊中添加關(guān)鍵詞

2、用戶執(zhí)行函數(shù)User_handle(nAsrRes); 處理語音識別結(jié)果

3、根據(jù)不同結(jié)果，串口打印不同的指令

PrintCom("{\"VoiceCommandCode\":1}");

4、MCU根據(jù)指令不同，執(zhí)行不同的動作

以JSON格式發(fā)送數(shù)據(jù)至串口，與語音識別模塊相連的MCU接收此結(jié)果，然后對此字符串進(jìn)行解析，進(jìn)而得到當(dāng)前識別的命令是什么，進(jìn)而做相應(yīng)的動作。

   
    //LD3320
    if(USART5_RX_STA&0x8000)
    {
     uart5Len=USART5_RX_STA&0x3f; //得到此次接收到的數(shù)據(jù)長度
    

     receive_json = cJSON_Parse(USART5_RX_BUF); //創(chuàng)建JSON解析對象，返回JSON格式是否正確
     if (!receive_json)
     {
     printf("JSON格式錯誤:%s \r\n", cJSON_GetErrorPtr()); //輸出json格式錯誤信息
     }
     else
     {
     printf("JSON格式正確:%s \r\n",cJSON_Print(receive_json) );
     item_obj = receive_json->child; //獲取name鍵對應(yīng)的值的信息
    

     while(item_obj)
     {
     char * string = item_obj->string;
    

     if(!strcmp(string,"VoiceCommandCode"))
     {
     if(item_obj->valueint==0)
     {
     printf("收到一級口令 智能報時 ... \r\n"); 
     }
     else if(item_obj->valueint==1)
     {
     printf("“現(xiàn)在幾點(diǎn)了”命令識別成功 \r\n");
    

     m_nCurrentVoicePlayTimes++;
     while(U5152_BSY){}
     if(m_nCurrentVoicePlayTimes%2==0)
     {
     sprintf((char*)dtbuf,"[v5][s5][m3]當(dāng)前時間為%02d時%02d分%02d秒 \r\n",NowHour,NowMinute,NowSecond);
     }
     else
     {
     sprintf((char*)dtbuf,"[v5][s5][m51]當(dāng)前時間為%02d時%02d分%02d秒 \r\n",NowHour,NowMinute,NowSecond);
     } 
     printf((char*)dtbuf);
     XFS_FrameInfo((char*)dtbuf) ;
     delay_ms(10);while(U5152_BSY){delay_ms(500);printf("while(U5152_BSY) \r\n");}
     } 
     }
    

     item_obj = item_obj->next;
    

     printf("while(item_obj) \r\n");
     }
    

     }
    

     cJSON_Delete(receive_json); 
    

     USART5_RX_STA=0; 
     memset(USART5_RX_BUF, 0, sizeof(USART5_RX_BUF)); //清空數(shù)組
    }

LDV7模塊固件下載：

1、打開編譯后的.hex文件

2、選對串口號，芯片型號后，選擇“下載/編程”按鈕，然后給STC單片機(jī)上電或者復(fù)位。

3、發(fā)出語音，測試語音識別結(jié)果

然后其他與LDV7模塊相連的MCU只要解析接收到的串口數(shù)據(jù)即可。

喜歡請關(guān)注微信公眾號：程序員小哈
有啥想玩的模塊，留言給我，咱們一起玩
如果有其他的問題可以評論區(qū)指出，有問必答，知無不言。

免責(zé)聲明：本文內(nèi)容由21ic獲得授權(quán)后發(fā)布，版權(quán)歸原作者所有，本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點(diǎn)，不代表本平臺立場，如有問題，請聯(lián)系我們，謝謝！