基于九齊單片機的智能音箱解決方案
目前的家庭智能音箱可以實現(xiàn)語音定鬧鐘?人工語音互動?語音播放音樂?查天氣?查百科?查路況等功能,鏈接網(wǎng)絡(luò)后可實現(xiàn)了解未來天氣、上網(wǎng)購物、打電話等更多功能,另外還可以連接第三方軟件,也可實現(xiàn)對家用智能電器的控制,可以說功能十分的強大。
智能音箱相比于傳統(tǒng)音箱的優(yōu)勢在于其能夠通過語音實現(xiàn)“隔空操作”。智能音箱的基本原理是用戶使用自然語言與音箱交流,音箱通過識別用戶的語音指令完成相應(yīng)任務(wù),在人們不方便使用手機或其他電子設(shè)備時提供幫助。用戶更多的是通過聲音與其進行交互,從而解放了雙眼和手指。
芯嶺技術(shù)為企業(yè)提供了一種基于九齊單片機的智能音箱解決方案,下文是方案的一些相關(guān)介紹。
一、智能音箱解決方案的主要技術(shù):
智能音箱的工作流程為語音喚醒,之后內(nèi)部處理,最后找到對應(yīng)內(nèi)容輸出,其中主要包括前端信號處理、語音喚醒、語音交互等技術(shù)。
1、前端信號處理
前端信號處理是在喚醒前進行準備工作,音箱工作時,麥列處于拾音狀態(tài),當接收到聲音時,對聲音進行處理,包括語音檢測、降噪、聲源定位和波束形成四個方面。
語音檢測用來檢測出音頻信號語音段的起始位置,并過濾不相干的非語音信號,達到分離語音段和非語音段信號的目的。降噪即減少噪音對智能音箱識別的影響,包含聲學回聲消除和去混響。實際環(huán)境中存在各種各樣的噪聲,采取降噪來降低噪聲干擾,提高信噪比。由于室內(nèi)語音會被墻壁等多次反射,采集到的聲音較混雜,采用去混響來處理。聲源定位是根據(jù)麥列,確定使用者的位置??梢杂脕碚故痉轿粺簦鰪娊换バЧ?,也可作為波束形成的前導任務(wù),確定空間濾波參數(shù)。波束形成通過利用空間濾波,將多路信號整合為一路,達到增強原始語音信號和抑制旁路信號的目的。
2、語音喚醒
語音喚醒又稱關(guān)鍵詞檢測,即在連續(xù)不斷的語音中將目標關(guān)鍵詞檢測出來,一般目標關(guān)鍵詞的個數(shù)較少。語音喚醒性能取決于喚醒率和誤喚醒率。喚醒率指將連續(xù)語流中存在的喚醒詞檢測出來的概率。語音喚醒常用的實現(xiàn)方式是dnn+hmm(深度神經(jīng)網(wǎng)絡(luò)+隱馬爾科夫模型)和lstm+ctc(長短時記憶網(wǎng)絡(luò)+全連接時序分類模型)。目前開源的喚醒方案可提供SDK,實現(xiàn)喚醒功能一般分為在線和離線版本。國內(nèi)主要以科大訊飛為代表。網(wǎng)上也有多種開源的小型語音識別引擎,可實現(xiàn)單獨的語音喚醒功能,性能參差不齊。
3、語音交互
語音交互包括語音識別、自然語言理解、對話管理、自然語言生成和語音合成。
語音識別技術(shù)也稱為自動語音識別,可將語音信息轉(zhuǎn)為文字信息。用戶發(fā)出的指令為語音,然而語音并不能直接拿來分析,需要轉(zhuǎn)化為文字。隨著深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用、大數(shù)據(jù)的使用和云計算的普及,語音技術(shù)已經(jīng)進入人們的日常生活,如科大訊飛、阿里巴巴的AliGenie、喜馬拉雅的小雅等。
自然語言理解的目的是將自然語言轉(zhuǎn)化為計算機易處理的形式,即接收到指令后,識別出用戶命令的所屬領(lǐng)域,之后再相應(yīng)領(lǐng)域識別用戶的意圖,最后進行實體抽取,確定意圖的參數(shù)。目前,自然語言處理使用的NPL算法是基于機器學習的,擁有各類語言處理的數(shù)據(jù)集,其中包括中文分詞、詞性標注、實體識別、句法分析以及自動文本分類等功能。
對話管理對連續(xù)對話的交互極為重要,一般的解決辦法是將上輪對話解析的參數(shù)作為全局變量,帶入到下一輪對話,根據(jù)當輪對話和一定條件來判斷是否保持在上一輪的領(lǐng)域,或是清空上下文。
自然語言生成是使計算機具有人一樣的表達和寫作的功能,即能根據(jù)一些關(guān)鍵信息及其在機器內(nèi)部的表達形式,經(jīng)過一個規(guī)劃過程,自動生成一段高質(zhì)量的自然語言文本。語音合成又叫文語轉(zhuǎn)換,能使智能音箱像人一樣朗讀任意給定的文本。主要合成方法有參數(shù)合成和拼接合成,其中參數(shù)合成計算量小,部署靈活,但自然度較差。拼接合成接近真人發(fā)音,存儲和計算資源高,一般只能在線合成。
二、智能音箱解決方案可實現(xiàn)功能:
芯嶺技術(shù)的智能音箱方案的主控芯片采用了臺灣九齊NY8A051F這款單片機,封裝型號為8引腳sop,該方案通過程序編寫,燒錄,電路設(shè)計完成功能模塊的搭建,產(chǎn)品設(shè)計完成之后,最終能夠?qū)崿F(xiàn)如下多種功能:
1、夜燈功能:七彩閃爍小夜燈,跟隨音樂的節(jié)奏閃爍;
2、LED顯示:外置顯示屏,電量顯示,音樂顯示;
3、時鐘顯示:自動適配時區(qū),24小時時鐘顯示;
4、語音交互:用語音替代了之前的觸摸按鈕等交互功能,方便您的生活。
深圳市芯嶺技術(shù)有限公司是一家創(chuàng)新的物聯(lián)網(wǎng)整體應(yīng)用解決方案商,從事芯片代理、方案開發(fā)、物聯(lián)網(wǎng)產(chǎn)品研發(fā)、生產(chǎn)、銷售,同時為眾多企業(yè)提供物聯(lián)網(wǎng)應(yīng)用解決方案服務(wù)。公司具備智能家電、智能家居、智能硬件、智能門店、智慧農(nóng)業(yè)等物聯(lián)網(wǎng)解決方案,公司一直致力于物聯(lián)網(wǎng)技術(shù)及市場推進。