當前位置:首頁 > 中國芯 > 芯嶺技術(shù)
[導讀]智能音箱相比于傳統(tǒng)音箱的優(yōu)勢在于其能夠通過語音實現(xiàn)“隔空操作”。智能音箱的基本原理是用戶使用自然語言與音箱交流,音箱通過識別用戶的語音指令完成相應(yīng)任務(wù),在人們不方便使用手機或其他電子設(shè)備時提供幫助。用戶更多的是通過聲音與其進行交互,從而解放了雙眼和手指。 芯嶺技術(shù)為企業(yè)提供了一種基于九齊單片機的智能音箱解決方案

目前的家庭智能音箱可以實現(xiàn)語音定鬧鐘?人工語音互動?語音播放音樂?查天氣?查百科?查路況等功能,鏈接網(wǎng)絡(luò)后可實現(xiàn)了解未來天氣、上網(wǎng)購物、打電話等更多功能,另外還可以連接第三方軟件,也可實現(xiàn)對家用智能電器的控制,可以說功能十分的強大。
智能音箱相比于傳統(tǒng)音箱的優(yōu)勢在于其能夠通過語音實現(xiàn)“隔空操作”。智能音箱的基本原理是用戶使用自然語言與音箱交流,音箱通過識別用戶的語音指令完成相應(yīng)任務(wù),在人們不方便使用手機或其他電子設(shè)備時提供幫助。用戶更多的是通過聲音與其進行交互,從而解放了雙眼和手指。
芯嶺技術(shù)為企業(yè)提供了一種基于九齊單片機的智能音箱解決方案,下文是方案的一些相關(guān)介紹。


一、智能音箱解決方案的主要技術(shù):

智能音箱的工作流程為語音喚醒,之后內(nèi)部處理,最后找到對應(yīng)內(nèi)容輸出,其中主要包括前端信號處理、語音喚醒、語音交互等技術(shù)。

1、前端信號處理

前端信號處理是在喚醒前進行準備工作,音箱工作時,麥列處于拾音狀態(tài),當接收到聲音時,對聲音進行處理,包括語音檢測、降噪、聲源定位和波束形成四個方面。

語音檢測用來檢測出音頻信號語音段的起始位置,并過濾不相干的非語音信號,達到分離語音段和非語音段信號的目的。降噪即減少噪音對智能音箱識別的影響,包含聲學回聲消除和去混響。實際環(huán)境中存在各種各樣的噪聲,采取降噪來降低噪聲干擾,提高信噪比。由于室內(nèi)語音會被墻壁等多次反射,采集到的聲音較混雜,采用去混響來處理。聲源定位是根據(jù)麥列,確定使用者的位置??梢杂脕碚故痉轿粺簦鰪娊换バЧ?,也可作為波束形成的前導任務(wù),確定空間濾波參數(shù)。波束形成通過利用空間濾波,將多路信號整合為一路,達到增強原始語音信號和抑制旁路信號的目的。

2、語音喚醒

語音喚醒又稱關(guān)鍵詞檢測,即在連續(xù)不斷的語音中將目標關(guān)鍵詞檢測出來,一般目標關(guān)鍵詞的個數(shù)較少。語音喚醒性能取決于喚醒率和誤喚醒率。喚醒率指將連續(xù)語流中存在的喚醒詞檢測出來的概率。語音喚醒常用的實現(xiàn)方式是dnn+hmm(深度神經(jīng)網(wǎng)絡(luò)+隱馬爾科夫模型)和lstm+ctc(長短時記憶網(wǎng)絡(luò)+全連接時序分類模型)。目前開源的喚醒方案可提供SDK,實現(xiàn)喚醒功能一般分為在線和離線版本。國內(nèi)主要以科大訊飛為代表。網(wǎng)上也有多種開源的小型語音識別引擎,可實現(xiàn)單獨的語音喚醒功能,性能參差不齊。

3、語音交互

語音交互包括語音識別、自然語言理解、對話管理、自然語言生成和語音合成。

語音識別技術(shù)也稱為自動語音識別,可將語音信息轉(zhuǎn)為文字信息。用戶發(fā)出的指令為語音,然而語音并不能直接拿來分析,需要轉(zhuǎn)化為文字。隨著深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用、大數(shù)據(jù)的使用和云計算的普及,語音技術(shù)已經(jīng)進入人們的日常生活,如科大訊飛、阿里巴巴的AliGenie、喜馬拉雅的小雅等。

自然語言理解的目的是將自然語言轉(zhuǎn)化為計算機易處理的形式,即接收到指令后,識別出用戶命令的所屬領(lǐng)域,之后再相應(yīng)領(lǐng)域識別用戶的意圖,最后進行實體抽取,確定意圖的參數(shù)。目前,自然語言處理使用的NPL算法是基于機器學習的,擁有各類語言處理的數(shù)據(jù)集,其中包括中文分詞、詞性標注、實體識別、句法分析以及自動文本分類等功能。

對話管理對連續(xù)對話的交互極為重要,一般的解決辦法是將上輪對話解析的參數(shù)作為全局變量,帶入到下一輪對話,根據(jù)當輪對話和一定條件來判斷是否保持在上一輪的領(lǐng)域,或是清空上下文。

自然語言生成是使計算機具有人一樣的表達和寫作的功能,即能根據(jù)一些關(guān)鍵信息及其在機器內(nèi)部的表達形式,經(jīng)過一個規(guī)劃過程,自動生成一段高質(zhì)量的自然語言文本。語音合成又叫文語轉(zhuǎn)換,能使智能音箱像人一樣朗讀任意給定的文本。主要合成方法有參數(shù)合成和拼接合成,其中參數(shù)合成計算量小,部署靈活,但自然度較差。拼接合成接近真人發(fā)音,存儲和計算資源高,一般只能在線合成。


二、智能音箱解決方案可實現(xiàn)功能:
芯嶺技術(shù)的智能音箱方案的主控芯片采用了臺灣九齊NY8A051F這款單片機,封裝型號為8引腳sop,該方案通過程序編寫,燒錄,電路設(shè)計完成功能模塊的搭建,產(chǎn)品設(shè)計完成之后,最終能夠?qū)崿F(xiàn)如下多種功能:
1、夜燈功能:七彩閃爍小夜燈,跟隨音樂的節(jié)奏閃爍;

2、LED顯示:外置顯示屏,電量顯示,音樂顯示;

3、時鐘顯示:自動適配時區(qū),24小時時鐘顯示;

4、語音交互:用語音替代了之前的觸摸按鈕等交互功能,方便您的生活。

深圳市芯嶺技術(shù)有限公司是一家創(chuàng)新的物聯(lián)網(wǎng)整體應(yīng)用解決方案商,從事芯片代理、方案開發(fā)、物聯(lián)網(wǎng)產(chǎn)品研發(fā)、生產(chǎn)、銷售,同時為眾多企業(yè)提供物聯(lián)網(wǎng)應(yīng)用解決方案服務(wù)。公司具備智能家電、智能家居、智能硬件、智能門店、智慧農(nóng)業(yè)等物聯(lián)網(wǎng)解決方案,公司一直致力于物聯(lián)網(wǎng)技術(shù)及市場推進。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉