(文章來源:曉芯智能語音)
? ? ?? 語音識別作為打造良好交互體驗的重要前提,今年的發(fā)展可謂是持續(xù)火爆。在智能音箱市場,令人首先想到的就是Amazon的Echo。Echo作為將自然語音轉(zhuǎn)化為在線指令的設(shè)備,其效率之高毋庸置疑,并且可保持在線的自然環(huán)境中的自然語言識別。
而國內(nèi)語音識別領(lǐng)域也開始爭奪大戰(zhàn)。以科大訊飛聽見系列產(chǎn)品為例,自2015年發(fā)布以來,總用戶突破1000萬,應(yīng)用于30余個行業(yè)。目前,已經(jīng)形成了以聽見智能會議系統(tǒng)、訊(詢)問筆錄系統(tǒng)、聽見轉(zhuǎn)寫網(wǎng)站、錄音寶APP、聽見智能會議服務(wù)等以智能語音轉(zhuǎn)寫技術(shù)為核心的產(chǎn)品和服務(wù)體系。
曉芯電話機器人就是基于語音識別技術(shù)的一種應(yīng)用產(chǎn)品。曉芯智能以服務(wù)低端勞力密集型企業(yè)為宗旨,幫助企業(yè)突破人工客服效率低、工作時間長的瓶頸,從而幫助企業(yè)擴大規(guī)模和提升業(yè)績。
我們所期望的語音識別實質(zhì)上是人機交互,大致上可以理解為人與機器之間無障礙溝通。在通信側(cè)音源質(zhì)量限制的情況下,曉芯機器人在對音源質(zhì)量通過算法進行智能降噪以及通信側(cè)持續(xù)優(yōu)化之后,仍然能以80%的識別率達到行業(yè)領(lǐng)先的水準(zhǔn)。但即便是達到100%也還是沒有實現(xiàn)真正的人機交互
而我們曉芯電話機器人有很多的客戶都問我們能不能達到語義識別?
目前來說確實不能,要從語音識別成功轉(zhuǎn)變成真正意義上的語義識別,在智能電話客服的技術(shù)實現(xiàn)上依舊存在難點,大量的多音字和同音詞是干擾機器人識別精準(zhǔn)度的的主要障礙。首先要獲得大量的數(shù)據(jù),用這些數(shù)據(jù)不斷訓(xùn)練,來提高識別的準(zhǔn)確率。這一步的跨越還存在多種難關(guān)要攻克。就目前的市場分析來看,語義識別只是慢慢滲透到我們的生活中,還沒有成熟的在行業(yè)中應(yīng)用自如。隨著技術(shù)不斷地成熟,曉芯智能也必定會將語義識別技術(shù)融合進曉芯電話機器人。
語義識別的三個層次,1、應(yīng)用層:包括行業(yè)應(yīng)用和智能語音交互系統(tǒng),2、NLP技術(shù)層:包括以語言學(xué)、計算機語言等學(xué)科為背景的,對自然語言進行詞語解析、信息抽取、時間因果、情緒判斷等等技術(shù)處理,最終達到讓計算機“懂”人類的語言的自然語言認(rèn)知,以及吧計算機數(shù)據(jù)轉(zhuǎn)化為自然語言的生成。3、底層數(shù)據(jù)層:詞典、數(shù)據(jù)集、語料庫、知識圖譜,以及外部世界常識性知識等都是予以是被算法木星的基礎(chǔ)。
語義識別技術(shù)可以分析網(wǎng)頁、文件、郵件、音頻、論壇、社交媒體中的大亮數(shù)據(jù),應(yīng)用領(lǐng)域廣泛,既可以直接應(yīng)用與醫(yī)療、教育、金融等行業(yè)。也可以通過技術(shù)接口應(yīng)用于所有智能語音交互場景,如智能家居、車載語音、可穿戴設(shè)備、VR、機器人等,從交互的方式上,也可以分為:事實問答、知識檢索、分類問題等。智能語音交互被看做未來人工智能技術(shù)中最值得期待的應(yīng)用場景。
人工智能作為國家戰(zhàn)略發(fā)展規(guī)劃之一,足見其重要性。在這個政策的驅(qū)動下,各種資源包括國家型自然科學(xué)基金、產(chǎn)業(yè)基金、地方政府財稅優(yōu)惠政策、人工智能相關(guān)實驗室、科技產(chǎn)業(yè)園區(qū)等切實促進人工智能的發(fā)展落地,為自動駕駛、計算機視覺、語音/語義識別創(chuàng)業(yè)提供了更好的條件和基礎(chǔ)設(shè)施。