科大訊飛在北京國家會議中心舉行了“人工智能+ 共創(chuàng)新世界——2016科大訊飛年度發(fā)布會”。此次發(fā)布會展示了科大訊飛人工智能的用戶交互界面AIUI在產(chǎn)品和市場方面的推進。
AIUI是科大訊飛研發(fā)的以語音識別為主,結合圖像、視覺及手勢識別的人機交互產(chǎn)品,它的集成包括雙全工技術、麥克風陣列技術、聲紋識別技術、方言識別、語義理解技術和和內(nèi)容服務,并能夠與眾多人工智能產(chǎn)品結合,使得人工智能產(chǎn)品都能在AIUI的界面下進行操作。
AIUI自2015年上線以來,在人機交互方面的應用涉及教育、政府、交通等領域。目前,科大訊飛給出的數(shù)據(jù)顯示,AIUI的用戶數(shù)量達到8.9億,日均使用量30億次。在未來,人機交互依然是科大訊飛在語音識別技術上的重點。
此次發(fā)布會介紹的主要產(chǎn)品和市場情況如下:
1. 語音聽寫
AIUI的語音聽寫功能已經(jīng)能做到直接用語音進行修改、翻譯、加標點,同時可以記憶人名,響應速度在200毫秒以內(nèi),在噪音環(huán)境下的錯誤率低至2.24%,并能更加準確地識別方言和口音。另外,該語音識別系統(tǒng)還有針對涉密場景的加密功能。
目前,AIUI的語音識別主要運用于會議紀要的即時成稿。今年,該語音識別系統(tǒng)還與最高法深度合作,主要運用于庭審記錄??拼笥嶏w方面的數(shù)據(jù)顯示,最高法處理普通案件庭審記錄的時間,由原先的3小時加快至5分鐘。
2. 實時互譯
科大訊飛的實時互譯系統(tǒng)可在網(wǎng)站使用,或下載app,它可以識別語音,進行實時翻譯并外放,主要用于同不同語種的人進行交流。目前,中維實時翻譯系統(tǒng)已經(jīng)出現(xiàn),并在援疆工作中發(fā)揮作用,用于援疆工作人員與新疆少數(shù)民族的人群進行交流。
科大訊飛表示,目前公司在漢英互譯領域處于世界領先水平,在未來還將開發(fā)世界主要語言的語音實時翻譯系統(tǒng),用于解決不同語種的人交流時的障礙。
3. 智能家居的人機交互
科大訊飛與智能家居方面的合作目前集中在電視領域,產(chǎn)品為訊飛電視助理。科大訊飛將自己的語音交互系統(tǒng)植入遙控器,用戶只要對遙控器說出指令,電視就會做出相應的反應,例如篩選影片、調(diào)整音量等。該產(chǎn)品目前已經(jīng)能夠支持更深度的人機交互,例如一些更隨意的指令,如“片尾音樂很好聽,這是什么歌”,系統(tǒng)便會顯示歌曲的歌名。
目前科大訊飛在智能家居領域已經(jīng)與3000多家廠商進行合作,今年已經(jīng)推出了1000多款產(chǎn)品。在未來,科大訊飛的語音交互系統(tǒng)還將植入更多的智能家居,人們可以用語音控制更多的家電,而不僅限于電視。
4. 車載語音交互系統(tǒng)
科大訊飛車載語音識別系統(tǒng)的最新產(chǎn)品為飛魚助手,它僅靠語音對話就能完成導航、尋找餐廳、播放音樂、接打電話等功能。這與AIUI的語音識別支持語音修改、學習人名有關。即便在打電話時,系統(tǒng)根據(jù)語音找到了錯誤的通訊錄好友,也可以直接通過語音進行修改。利用飛魚助手導航時,系統(tǒng)可以識別地名的簡稱、別稱等。
未來,科大訊飛希望在自動駕駛方向有所進展,希望能夠?qū)⒆詣玉{駛環(huán)境營造得更加人性化,這就要求在人機交互方面更加自然,機器能夠與人類進行更深層次的對話。
5. 金融服務機器人
科大訊飛推出的“曉曼機器人”目前已經(jīng)運用于銀行服務中。這款金融服務機器人能夠識別用戶的語音指令,并在屏幕上推送相關的金融服務。另外,“曉曼機器人”還可以在銀行大廳內(nèi)為用戶指路,帶著用戶到相應窗口辦理業(yè)務。
6個性化教育
科大訊飛研發(fā)的自動作文評閱系統(tǒng)已經(jīng)運用于四六級考試的閱卷中,能夠給試卷打分,并提出修改意見。另外,科大訊飛的數(shù)字個性化推薦教育系統(tǒng),能夠分析考試中各個題目的錯誤率,并列出典型錯誤,根據(jù)不同學生不同的出錯情況,推送不同的錯題講解,提供個性化的學習內(nèi)容,并節(jié)省了教師統(tǒng)一講解的時間。目前該系統(tǒng)已經(jīng)運用于北師大二附中、黃岡中學廣州分校等學校的教育中。
科大訊飛在2014年的12月宣布“訊飛超腦”計劃,目標為讓機器人在3~5年內(nèi)考上大學。科大訊飛在教育方面推廣的人工智能技術,除了上述功能外,還有一個目的即是機器學習。通過匯總所有用戶的知識和錯誤,使機器不斷認知、學習、迭代,達到比人類更高的學習效率。至于最終能否完成“3至5年考上大學”的目標,目前依然沒有結論。
7. 語音模仿
“訊飛配音閣”是科大訊飛在語音模仿領域的主要產(chǎn)品之一,目前手機app已經(jīng)開放下載。這款產(chǎn)品能夠模仿不同人物的聲音,包括音調(diào)音色和說話時的語調(diào)習慣。科大訊飛的語音模仿系統(tǒng)主要運用方向為電影配音,即省去演員后期配音的工作,直接讓機器來代替演員完成配音工作。另外,普通用戶也可以利用語音模仿系統(tǒng),設置智能設備的聲音,例如將手機講故事的聲音設置為父母,情侶間設置對方的聲音為其路況導航等