一站式智能人機(jī)交互服務(wù)讓機(jī)器人時(shí)代觸手可及
不論是不溫不火的智能穿戴、智能家居類產(chǎn)品,還是最近大火的各種用途的智能機(jī)器人。我們明顯感受到在硬件智能化的過程中,語音交互已成為一項(xiàng)普遍并且關(guān)鍵的交互、控制技術(shù),只需動(dòng)一下“嘴巴”,在我們生活周圍的智能產(chǎn)品就會(huì)實(shí)時(shí)改變所處環(huán)境的溫度、濕度、亮度等,機(jī)器人還會(huì)給你唱歌、跳舞,陪伴孩子。無可厚非語音交互是一項(xiàng)極具無限前景的人工智能交互技術(shù)。
作為中國最大的智能語音技術(shù)提供商,科大訊飛一直積極耕耘智能語音產(chǎn)業(yè),推出了全球首個(gè)移動(dòng)互聯(lián)網(wǎng)智能交互平臺(tái)“訊飛開放平臺(tái)”, 它是一個(gè)以語音交互為核心的人工智能開放平臺(tái),為移動(dòng)互聯(lián)網(wǎng)、智能硬件、機(jī)器人等領(lǐng)域的開發(fā)伙伴提供開放技術(shù)服務(wù)和解決方案。
訊飛開放平臺(tái)產(chǎn)品總監(jiān) 張良春
據(jù)來到2016中國硬件創(chuàng)新大賽深圳實(shí)戰(zhàn)對(duì)接會(huì)的訊飛開放平臺(tái)產(chǎn)品總監(jiān)張良春介紹,目前平臺(tái)日服務(wù)量近15億人次,為13萬開發(fā)伙伴和8終端用戶提供語音及人工智能交互服務(wù),普通話識(shí)別準(zhǔn)確率突破95%,并開放多達(dá)十八種方言。
訊飛開放平臺(tái)作為全球首個(gè)開放的智能交互技術(shù)服務(wù)平臺(tái),致力于為開發(fā)者打造一站式智能人機(jī)交互解決方案。用戶可通過互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng),使用任何設(shè)備、在任何時(shí)間、任何地點(diǎn),隨時(shí)隨地享受訊飛開放平臺(tái)提供的“聽、說、讀、寫……”等全方位的人工智能服務(wù)。目前,開放平臺(tái)以“云+端”的形式向開發(fā)者提供語音合成、語音識(shí)別、語音喚醒、語義理解、人臉識(shí)別、個(gè)性化彩鈴、移動(dòng)應(yīng)用分析等多項(xiàng)服務(wù)。
張總作為技術(shù)負(fù)責(zé)人參與構(gòu)建了具備面向十億級(jí)互聯(lián)網(wǎng)用戶提供語音交互服務(wù)能力的“訊飛開放平臺(tái)”及整個(gè)平臺(tái)的數(shù)據(jù)建設(shè)工作。他現(xiàn)在負(fù)責(zé)訊飛開放平臺(tái)智能硬件業(yè)務(wù)線產(chǎn)品相關(guān)工作,協(xié)助上百家機(jī)器人公司進(jìn)行產(chǎn)品研發(fā)和落地,在人機(jī)交互方面有大量的實(shí)踐經(jīng)驗(yàn)。
國內(nèi)外企業(yè)、中小創(chuàng)業(yè)團(tuán)隊(duì)和個(gè)人開發(fā)者,均可在訊飛開放平臺(tái)直接體驗(yàn)世界領(lǐng)先的語音技術(shù),并簡單快速集成到產(chǎn)品中,讓產(chǎn)品具備“能聽會(huì)說會(huì)思考會(huì)預(yù)測”的功能。“用戶在訊飛開放平臺(tái)體驗(yàn)諸多免費(fèi)服務(wù)的同時(shí),也可以根據(jù)用戶自身的技術(shù)特點(diǎn)和產(chǎn)品性能,對(duì)自身的產(chǎn)品進(jìn)行優(yōu)化,并且根據(jù)產(chǎn)品需求找到訊飛進(jìn)行深度定制。”張總說。
目前,訊飛開放平臺(tái)針對(duì)運(yùn)算能力較弱的設(shè)備,也提供了輕量級(jí)的MSCmini,小型設(shè)備的語音交互體驗(yàn)依舊出色;針對(duì)家居場景的噪聲環(huán)境和遠(yuǎn)距離對(duì)話情況,訊飛開放平臺(tái)推出完善的智能家居遠(yuǎn)場語音交互方案。針對(duì)機(jī)器人的噪聲環(huán)境和遠(yuǎn)距離對(duì)話情況,訊飛開放平臺(tái)推出軟硬一體化的機(jī)器人語音交互方案。
他表示,以前接入平臺(tái)移動(dòng)應(yīng)用比較多,訊飛開放平臺(tái)5年來為眾多移動(dòng)應(yīng)用提供了穩(wěn)定可靠的語音云服務(wù),海量服務(wù)器輕松應(yīng)對(duì)高并發(fā)訪問。隨著近幾年各種智能硬件的興起,接入訊飛開放平臺(tái)中智能家居類、可穿戴設(shè)備、機(jī)器人領(lǐng)域的設(shè)備居多。
當(dāng)語音技術(shù)作為智能硬件的重要入口,讓人機(jī)交互內(nèi)容豐富,體驗(yàn)自然簡潔。但目前的語音交互在實(shí)際應(yīng)用中依然不盡如人意。你可能遇到過以下問題:交互需要按照雙方的發(fā)言順序來緩沖識(shí)別;距離、環(huán)境噪音等因素嚴(yán)重干擾語音識(shí)別的正確率;識(shí)別系統(tǒng)不能完全理解用戶的真實(shí)本意。
科大訊飛認(rèn)為要真正實(shí)現(xiàn)流暢的人機(jī)交互,必須滿足四點(diǎn):第一是遠(yuǎn)場降噪;第二是方言識(shí)別;第三是全雙工,隨時(shí)隨地在聽;第四個(gè)自動(dòng)糾錯(cuò),主動(dòng)糾錯(cuò),支持多輪對(duì)話、打斷、上下文相關(guān)。只有這些都具備,才是萬物互聯(lián)時(shí)代真正的人機(jī)語音交互系統(tǒng)。
于是,科大訊飛“聰明”地以語音為主結(jié)合圖像視覺及手寫識(shí)別,以及整個(gè)人工智能功能集結(jié)在一起,推出了業(yè)界首個(gè)人工智能的用戶交互界面——AIUI。
AIUI它集成了包括雙全工技術(shù)、麥克風(fēng)陣列技術(shù)、聲紋識(shí)別技術(shù)、方言識(shí)別、語義理解技術(shù)和和內(nèi)容服務(wù)。通過統(tǒng)一的交互接口,可以讓訊飛各種人工智能能力,非常方便的被用戶使用。在線離線能力的靈活搭配,并具備很強(qiáng)的服務(wù)拓展的功能,使得未來最新的人工智能成果都可以放到AIUI的統(tǒng)一界面下。
AIUI服務(wù)實(shí)現(xiàn)三個(gè)一體化,第一是軟硬件一體化,智能硬件可以直接采購訊飛的各種類型的麥克風(fēng)陣列,使它360度使它五到八米之外都可以方便的來操控這個(gè)設(shè)備;
其次是云和端一體。有越來越多的家電設(shè)備智能家居它不聯(lián)網(wǎng),那么能聯(lián)網(wǎng)我們的能力在后臺(tái),如果不能聯(lián)網(wǎng)或者我們要節(jié)約后臺(tái)運(yùn)算資源可以直接有端的解決方案。
第三是技術(shù)服務(wù)一體化。通過這個(gè)AIUI界面,訊飛可以給開發(fā)伙伴各種應(yīng)用差異化的定制。那么,當(dāng)然也可以應(yīng)用在各種語音識(shí)別場景,包括后臺(tái)的語義定制可以實(shí)現(xiàn)技術(shù)服務(wù)一體化。
他指出,未來人機(jī)交互方面,根據(jù)技術(shù)特點(diǎn)和產(chǎn)品需求訊飛會(huì)提更多方案,使得產(chǎn)品和技術(shù)融合的更好。他認(rèn)為,智能家居想象空間很大。比如,未來居家所處環(huán)境可根據(jù)個(gè)人生活習(xí)慣、狀態(tài)做出即時(shí)改變,個(gè)性化的和多種控制結(jié)合是趨勢。當(dāng)然這目前只是暢想啦!當(dāng)下最重要的是結(jié)合技術(shù)進(jìn)步,產(chǎn)出更多切實(shí)改善消費(fèi)者生活的智能硬件。