智能系統(tǒng)8大展望:2013將成發(fā)展元年
2012年對(duì)許多人來說利用語音控制手機(jī)、汽車、電腦甚至是電視機(jī)都是非常平常的事了。之所以如此,是因?yàn)檎Z音識(shí)別和自然語言理解(NLU)領(lǐng)域取得了重大進(jìn)步。不久前還被認(rèn)為是科幻小說里才會(huì)出現(xiàn)的產(chǎn)品功能,現(xiàn)在已經(jīng)變成主流手機(jī)和消費(fèi)設(shè)備的基本功能。語音用戶界面和“虛擬個(gè)人助手”已經(jīng)成為福特、三星、蘋果和谷歌(微博)等企業(yè)開展廣告營銷活動(dòng)時(shí)重點(diǎn)宣傳的一個(gè)關(guān)鍵特色,這一特色將會(huì)引起前所未有的關(guān)注和市場需求。
人們對(duì)這些全新的語音驅(qū)動(dòng)用戶界面抱有很大的熱情。許多報(bào)道指出,用戶對(duì)他們的新“助手”充滿感情。不過,許多人也認(rèn)識(shí)到,這些系統(tǒng)仍在不斷改進(jìn)中,需要不斷的創(chuàng)新。預(yù)計(jì),現(xiàn)有的虛擬個(gè)人助手將演變成無處不在的智能系統(tǒng),通過語音、文本、視覺、觸覺和手勢與人進(jìn)行互動(dòng),并將基于周圍的環(huán)境信息,如位置等,讓所有互動(dòng)具有更大的相關(guān)性。
以下是對(duì)2013年智能系統(tǒng)發(fā)展的8點(diǎn)展望:
1、語音識(shí)別精度更高
語音識(shí)別是智能系統(tǒng)技術(shù)的基礎(chǔ),語音識(shí)別的準(zhǔn)確性一直在穩(wěn)步提高,之所以這么說,是因?yàn)楝F(xiàn)在已經(jīng)把更加豐富的訓(xùn)練數(shù)據(jù)、更加強(qiáng)大的計(jì)算能力以及全新更加復(fù)雜的建模方法(如目前非常流行的基于人腦如何完成模式識(shí)別的技術(shù)“深度信念網(wǎng)”( Deep Belief Networks))結(jié)合在一起,提高了語音識(shí)別的精度。
2、設(shè)備將具備更強(qiáng)的識(shí)別能力
不管是在城市街道上,還是在汽車?yán)锘蚩蛷d里,語音識(shí)別的功能性和精確性正越來越高。一流的信號(hào)處理能夠區(qū)分不同的聲音,語音生物統(tǒng)計(jì)學(xué)有助于判定誰在說話。并排的多個(gè)麥克風(fēng)能夠動(dòng)態(tài)引導(dǎo)“聽光束”,并可在攝像頭的輔助下跟蹤用戶的位置。因此,在與用戶聯(lián)系更加緊密的移動(dòng)設(shè)備上應(yīng)用這項(xiàng)功能,將會(huì)提高移動(dòng)設(shè)備的識(shí)別能力。
3、設(shè)備將具備更強(qiáng)的感知能力
未來完成一項(xiàng)任務(wù)可減少許多必需的步驟,如必須選擇設(shè)備、打開設(shè)備、找到目標(biāo)應(yīng)用、啟動(dòng)應(yīng)用,然后與應(yīng)用互動(dòng)。不久,用戶將可以簡單地用自然語言告訴處于睡眠狀態(tài)的設(shè)備干什么——不用觸碰它。具備這種低功耗模式狀態(tài)下聽功能的設(shè)備將可以鑒別用戶,并通過逐步喚醒其處理器的其他功能來確認(rèn)要求的操作,最終按照要求完成相應(yīng)的操作。
4、互動(dòng)性的普遍性和連續(xù)性
隨著語音識(shí)別技術(shù)和自然語言理解技術(shù)的發(fā)展,用戶希望能夠在不同設(shè)備(智能手機(jī)、平板電腦、電視或汽車)的顯示屏上進(jìn)行互動(dòng),并擁有一致的體驗(yàn)。用戶可以在一臺(tái)設(shè)備上開始任務(wù),在另一臺(tái)設(shè)備上完成任務(wù)。這種互動(dòng)將通過基于客戶識(shí)別器和云識(shí)別器,以及自然語言理解引擎的框架聯(lián)系在一起。用戶的互動(dòng)歷史將被聚合在云端,用來改進(jìn)識(shí)別模型,以便在其他所有相關(guān)設(shè)備中應(yīng)用。
5、自然語言處理和人工智能將更加智能化
自然語言理解(猜測用戶輸入并據(jù)此操作的意圖)的能力也在不斷提高。今天的一流技術(shù)把功能強(qiáng)大的語言框架(被稱作符號(hào)處理)、知識(shí)顯示法(知識(shí)本體)和利用大數(shù)據(jù)用觀察到的例子和模型來填充框架的機(jī)器學(xué)習(xí)結(jié)合在一起。這種互補(bǔ)性至關(guān)重要:過去的符號(hào)方法被證明是不可靠的,純數(shù)據(jù)驅(qū)動(dòng)型自然語言理解一般僅是膚淺的理解。
智能系統(tǒng)現(xiàn)在已從對(duì)任務(wù)目標(biāo)的預(yù)定程序描述遷移至以用戶的背景、參數(shù)選擇和互動(dòng)歷史為條件的動(dòng)態(tài)操作,系統(tǒng)據(jù)此有效地自我編程。這將允許我們從簡單的任務(wù)向更加復(fù)雜的任務(wù)過渡,可能必須訪問協(xié)調(diào)工作流中的各種應(yīng)用和信息源。
比如,為了響應(yīng)“核查下比爾(Bill)和艾利森(Allison)明天晚上是否來吃飯”的請(qǐng)求,手機(jī)個(gè)人助手將確定最喜愛的飯店,并基于通信歷史來決定你所說的是哪個(gè)比爾和艾利森,同時(shí)聯(lián)系對(duì)方的虛擬助手核對(duì)他們的安排,并草擬一份有關(guān)預(yù)定和人員組成等信息的電子郵件發(fā)給對(duì)方。
這種推理屬于人工智能范疇,不過,早期系統(tǒng)可靠性差,新一代系統(tǒng)將依靠一種被稱為“非單調(diào)推理”的更加靈活和穩(wěn)健的方法,在模糊狀態(tài)下表現(xiàn)更好,并生成近似的解決方案,盡管可能無法給出準(zhǔn)確的解決方案。
6、語義搜索將直接訪問信息
理解用戶意圖可以穿過多個(gè)屏幕的應(yīng)用圖標(biāo)、文件夾和子文件夾,或一系列中間網(wǎng)頁。在搜索方面,頻繁提問的自然語言理解應(yīng)用可以跳過搜索引擎檢索的所有象征性鏈接列表,直接導(dǎo)向希望的目的地。這種快速和直接訪問信息的功能非常強(qiáng)大,潛在地威脅到普通的搜索業(yè)務(wù)。一些搜索服務(wù)提供商也開始測試用直接應(yīng)答提問來替代網(wǎng)頁鏈接,不過,他們現(xiàn)在還不允許用戶直接獲取想要的第三方內(nèi)容。
7、用戶關(guān)注虛擬助手
用戶服務(wù)業(yè)務(wù)很難按照有效和可理解的方式組織成菜單結(jié)構(gòu)——不管是在互動(dòng)語音應(yīng)答(IVR)系統(tǒng),還是在移動(dòng)應(yīng)用中。專業(yè)化虛擬助手的自然語言理解將完全繞開互動(dòng)語音應(yīng)答系統(tǒng)直接訪問信息,此外還將支持靈活的對(duì)話,允許用戶前瞻性地提供未受提示的信息,任意在不同聯(lián)系中心功能間切換。
8、自然語言理解將改進(jìn)醫(yī)療保健
醫(yī)師利用語音識(shí)別系統(tǒng)來描述包含大量關(guān)鍵信息的接診患者病情,但這很難實(shí)現(xiàn)共享。利用自然語言理解應(yīng)用,與醫(yī)學(xué)有關(guān)的事實(shí)將被篩選并被輸入電子健康記錄數(shù)據(jù)庫。自動(dòng)化事實(shí)篩選的精度現(xiàn)在已經(jīng)接近人工操作,使得系統(tǒng)可以幫助醫(yī)師“說清”患者的病情。改進(jìn)的患者信息記錄能被進(jìn)一步處理,以分配帳單代碼,節(jié)約成本,提高信息和護(hù)理的質(zhì)量。
綜合利用這些進(jìn)步表明新一代計(jì)算——第三代計(jì)算革命的開始,意義相當(dāng)于引入圖形和觸摸用戶界面。自然語言理解和人工智能在設(shè)備功耗管理、快速網(wǎng)絡(luò)以及基于云的內(nèi)容、服務(wù)和應(yīng)用領(lǐng)域取得了長足的進(jìn)步,并發(fā)揮了巨大作用。
2013年將是智能系統(tǒng)年,期待著那些夢(mèng)幻般的智能應(yīng)用能夠盡快變成現(xiàn)實(shí)。