語音通信系統(tǒng)的設(shè)計原理方案有哪些?
隨著科學(xué)技術(shù)和人工智能的不斷發(fā)展,智能生活已經(jīng)深入生活各個方面,而AI語音控制作為智能化的前驅(qū),其智能化程度及準(zhǔn)確性將在很大程度上影響著人工智能的發(fā)展,本文將以某客戶智能語音控制空調(diào)應(yīng)用為例,分享啟英泰倫推出的第三代高性能神經(jīng)網(wǎng)絡(luò)智能語音芯片,以便給廣大工程師們提供產(chǎn)品設(shè)計思路及產(chǎn)品解決方案。
傳統(tǒng)空調(diào)遙控器存在控制復(fù)雜,老人,孩子控制不便捷,以及容易找不到等不足,因此智能語音空調(diào)的核心功能就是通過AI語音控制取代傳統(tǒng)的遙控器控制,但是常用語音芯片存在語音識別準(zhǔn)確率低,識別速度慢,AI訓(xùn)練成本大,系統(tǒng)設(shè)計復(fù)雜,使用體驗差,用戶體驗感大大降低。
針對類似項目需求,可采用啟英泰倫推出的第三代高性能神經(jīng)網(wǎng)絡(luò)智能語音芯片,包括CI13XX和CI230X系列,芯片集成了啟英泰倫自研的腦神經(jīng)網(wǎng)絡(luò)處理器BNPU V3,且CI230X系列芯片支持Wi-Fi及 BLE 5.1 無線通信協(xié)議。
如上圖所述,啟英泰倫第三代智能語音芯片集成度更高,外圍可擴(kuò)展更豐富應(yīng)用,通過串口可擴(kuò)展上位機(jī)MCU、WiFi、BLE、2.4G等射頻芯片; 通過通用ADC或I2C可輸入溫度、濕度等傳感器信號,從而實現(xiàn)AI控制操作;另外,通過PWM或其它GPIO可實現(xiàn)對開關(guān)控制、電機(jī)控制等,可極大提升系統(tǒng)功能性和設(shè)計靈活性;本方案最為突出的是CI230X系列芯片本身集成WIFI和BLE,形成“語音+WiFi+BLE”三合一單芯片,僅需少量電阻電容等外圍器件就可以實現(xiàn)各類智能語音離在線產(chǎn)品及IoT硬件方案,性價比極高。
如上圖所示,啟英泰倫第三代智能語音芯片采用行業(yè)首創(chuàng)的BNPU3.0語音算法,通過將不同方向人聲分離,抑制干擾人聲等技術(shù),提高目標(biāo)人聲識別率,且能夠在低信噪比環(huán)境下,減小語音失真,提升目標(biāo)語音識別率,從而使得其語音識別效果優(yōu)于其它語音芯片,實測準(zhǔn)確度可達(dá)97%以上,用戶的空調(diào)控制指令能被準(zhǔn)確清晰地接收或響應(yīng),不會因為用戶周圍的噪聲或雜音而影響設(shè)備控制;更不會被誤喚醒,以避免發(fā)生半夜”鬼音“控制,而嚴(yán)重影響用戶睡眠。
且方案支持離線自定義喚醒詞和命令詞,支持離線語義識別,支持本地聲紋識別和本地NLP(部分型號),能夠通過上下文關(guān)聯(lián),多輪對話及意圖理解,識別相應(yīng)速度極快,采用此款方案設(shè)計的智能語音空調(diào),使用離線喚醒指令,系統(tǒng)響應(yīng)可短至0.8s以內(nèi)(指從指令識別到設(shè)備動作完成),而傳統(tǒng)語音控制方案往往需要2-3s,做到隨時控制隨時響應(yīng),極大地提升用戶的智能生活體驗。
通常情況下,IP語音電話系統(tǒng)和IP電話系統(tǒng)可以視為同一概念,都是使用IP協(xié)議來進(jìn)行語音通信的系統(tǒng)。當(dāng)然,也要認(rèn)識到,具體術(shù)語的使用可能會因地區(qū)、行業(yè)或上下文而有所不同,所以,在特定情況下,可能需要更明確地了解具體的系統(tǒng)或解決方案是指哪種類型的IP通信。
訊美時代將基于兩者的同一性,以近20年的行業(yè)經(jīng)驗,給出答案,希望有助于行業(yè)內(nèi)外人士,進(jìn)一步認(rèn)識IP電話系統(tǒng),為IP融合通訊行業(yè)的發(fā)展,共同努力。
1.什么是IP電話系統(tǒng)
1.1 定義和概念
IP電話系統(tǒng)(IP Telephony System)是一種利用IP語音電話技術(shù)來實現(xiàn)電話功能的系統(tǒng)。IP電話系統(tǒng)可以將語音信號轉(zhuǎn)換為數(shù)據(jù)包,通過IP網(wǎng)絡(luò)進(jìn)行傳輸,然后再轉(zhuǎn)換為語音信號,實現(xiàn)點對點或多點之間的通話。IP電話系統(tǒng)可以與傳統(tǒng)的電話系統(tǒng)互聯(lián)互通,也可以與其他的網(wǎng)絡(luò)應(yīng)用如電子郵件、即時通訊、視頻會議等集成,提供更多的功能和服務(wù)。
1.2 歷史和發(fā)展
IP電話系統(tǒng)的起源可以追溯到20世紀(jì)90年代初,當(dāng)時一些研究人員和愛好者開始嘗試?yán)没ヂ?lián)網(wǎng)來進(jìn)行語音通信。1995年,一家名為VocalTec的公司推出了第一個商用的IP語音電話軟件,名為Internet Phone。該軟件允許用戶通過撥號上網(wǎng)和麥克風(fēng)、耳機(jī)等設(shè)備,在互聯(lián)網(wǎng)上進(jìn)行實時的語音對話。隨著互聯(lián)網(wǎng)的普及和寬帶技術(shù)的發(fā)展,IP語音電話技術(shù)逐漸成為一種主流的通信方式,不僅在個人用戶之間,也在企業(yè)和政府機(jī)構(gòu)之間得到了廣泛的應(yīng)用?;贗P語音電話技術(shù)的各種IP電話系統(tǒng)也相繼出現(xiàn),如基于H.323協(xié)議的Avaya、基于SIP協(xié)議的Cisco、基于云計算的Skype等。目前,IP電話系統(tǒng)已經(jīng)成為一種成熟和穩(wěn)定的技術(shù),擁有多種標(biāo)準(zhǔn)和協(xié)議,如H.323、SIP、MGCP、MEGACO等。IP電話系統(tǒng)也在不斷地創(chuàng)新和發(fā)展,與云計算、人工智能、5G網(wǎng)絡(luò)等新技術(shù)相結(jié)合,提供更高效、更智能、更便捷的通信體驗。
2.IP電話系統(tǒng)的主要設(shè)備
IP電話系統(tǒng)的主要設(shè)備和軟件包括:
IP電話:IP電話是一種可以直接接入IP網(wǎng)絡(luò)的電話設(shè)備,具有語音編解碼、數(shù)據(jù)包封裝、信號處理等功能。IP電話可以是硬件設(shè)備,如專用的IP電話機(jī)、智能手機(jī)等,也可以是軟件設(shè)備,如安裝在電腦或移動設(shè)備上的IP語音電話軟件。
網(wǎng)關(guān):網(wǎng)關(guān)是一種可以實現(xiàn)不同網(wǎng)絡(luò)之間的互聯(lián)互通的設(shè)備,如IP網(wǎng)絡(luò)和PSTN(公共交換電話網(wǎng))。網(wǎng)關(guān)可以將IP語音電話系統(tǒng)的數(shù)據(jù)包轉(zhuǎn)換為PSTN的模擬或數(shù)字信號,或者反之,從而實現(xiàn)IP語音電話系統(tǒng)和傳統(tǒng)電話系統(tǒng)之間的通話。
服務(wù)器:服務(wù)器是一種可以提供各種服務(wù)和功能的設(shè)備,如注冊、認(rèn)證、路由、計費、錄音、會議、語音郵件等。服務(wù)器可以根據(jù)不同的協(xié)議和標(biāo)準(zhǔn)進(jìn)行工作,如H.323服務(wù)器、SIP服務(wù)器等。
網(wǎng)絡(luò)設(shè)備:網(wǎng)絡(luò)設(shè)備是一種可以實現(xiàn)IP網(wǎng)絡(luò)的構(gòu)建和管理的設(shè)備,如路由器、交換機(jī)、防火墻等。網(wǎng)絡(luò)設(shè)備可以對IP語音電話系統(tǒng)的數(shù)據(jù)包進(jìn)行轉(zhuǎn)發(fā)、優(yōu)化、保護(hù)等操作,提高通話質(zhì)量和安全性。
3.IP電話系統(tǒng)的優(yōu)勢
相比傳統(tǒng)電話系統(tǒng),IP電話系統(tǒng)具有以下幾個優(yōu)勢:
3.1 通話質(zhì)量
IP電話系統(tǒng)可以利用數(shù)字信號處理技術(shù),對語音信號進(jìn)行壓縮、編碼、加密、過濾等操作,提高通話質(zhì)量和安全性。IP電話系統(tǒng)也可以利用網(wǎng)絡(luò)技術(shù),對數(shù)據(jù)包進(jìn)行優(yōu)先級分配、負(fù)載均衡、擁塞控制等操作,減少延遲、丟包、抖動等問題,提高通話穩(wěn)定性和可靠性。
3.2 成本節(jié)省
IP電話系統(tǒng)可以利用現(xiàn)有的IP網(wǎng)絡(luò)設(shè)施,無需額外建設(shè)專用的電話線路和交換機(jī),降低基礎(chǔ)設(shè)施投資和維護(hù)成本。IP電話系統(tǒng)也可以利用互聯(lián)網(wǎng)提供的低廉或免費的通信服務(wù),無需支付昂貴的長途或國際電話費用,降低通信開支。
3.3 功能豐富
IP電話系統(tǒng)可以利用IP網(wǎng)絡(luò)提供的多種應(yīng)用和服務(wù),實現(xiàn)更多的功能和價值,如視頻會議、即時通訊、語音郵件、呼叫轉(zhuǎn)移、呼叫等待、呼叫保持、呼叫錄音等。IP電話系統(tǒng)也可以與其他信息系統(tǒng)進(jìn)行集成和協(xié)作,如電子郵件、數(shù)據(jù)庫、客戶關(guān)系管理(CRM)等,提高工作效率和客戶滿意度。
4.IP電話系統(tǒng)的應(yīng)用領(lǐng)域
由于IP電話系統(tǒng)具有的三大優(yōu)勢,IP電話系統(tǒng)得到行業(yè)用戶認(rèn)可,應(yīng)用于多個領(lǐng)域,正如訊美時代的客戶,也廣泛分布于各行各業(yè)。
4.1 企業(yè)
IP電話系統(tǒng)可以幫助企業(yè)實現(xiàn)高效、低成本、多功能的內(nèi)部和外部通信,提高企業(yè)的競爭力和盈利能力。IP電話系統(tǒng)可以實現(xiàn)企業(yè)內(nèi)部的分支機(jī)構(gòu)、部門、員工之間的無縫連接,實現(xiàn)遠(yuǎn)程辦公、移動辦公、協(xié)同辦公等模式。IP電話系統(tǒng)也可以實現(xiàn)企業(yè)外部的客戶、供應(yīng)商、合作伙伴之間的高質(zhì)量通信,提高客戶服務(wù)、供應(yīng)鏈管理、商務(wù)談判等效果。
4.2 教育
IP電話系統(tǒng)可以幫助教育機(jī)構(gòu)實現(xiàn)高效、低成本、多功能的教學(xué)和管理,提高教育質(zhì)量和水平。IP電話系統(tǒng)可以實現(xiàn)教育機(jī)構(gòu)內(nèi)部的教師、學(xué)生、管理員之間的無縫連接,實現(xiàn)遠(yuǎn)程教學(xué)、在線學(xué)習(xí)、協(xié)同學(xué)習(xí)等模式。IP電話系統(tǒng)也可以實現(xiàn)教育機(jī)構(gòu)外部的其他學(xué)校、專家、社會資源之間的高質(zhì)量通信,提高教育交流、教育合作、教育創(chuàng)新等效果。
4.3 醫(yī)療
IP電話系統(tǒng)可以幫助醫(yī)療機(jī)構(gòu)實現(xiàn)高效、低成本、多功能的診療和管理,提高醫(yī)療質(zhì)量和水平。IP電話系統(tǒng)可以實現(xiàn)醫(yī)療機(jī)構(gòu)內(nèi)部的醫(yī)生、護(hù)士、患者、管理員之間的無縫連接,實現(xiàn)遠(yuǎn)程診斷、遠(yuǎn)程監(jiān)護(hù)、遠(yuǎn)程會診等模式。IP電話系統(tǒng)也可以實現(xiàn)醫(yī)療機(jī)構(gòu)外部的其他醫(yī)院、專家、社會資源之間的高質(zhì)量通信,提高醫(yī)療交流、醫(yī)療合作、醫(yī)療創(chuàng)新等效果。
4.4 政府
IP電話系統(tǒng)可以幫助政府機(jī)構(gòu)實現(xiàn)高效、低成本、多功能的執(zhí)政和管理,提高政府效能和形象。IP電話系統(tǒng)可以實現(xiàn)政府機(jī)構(gòu)內(nèi)部的領(lǐng)導(dǎo)、干部、公務(wù)員之間的無縫連接,實現(xiàn)遠(yuǎn)程辦公、移動辦公、協(xié)同辦公等模式。IP電話系統(tǒng)也可以實現(xiàn)政府機(jī)構(gòu)外部的民眾、企業(yè)、社會組織之間的高質(zhì)量通信,提高民意征集、民事服務(wù)、民主參與等效果。