當(dāng)前位置:首頁 > 嵌入式 > 嵌入式動(dòng)態(tài)
[導(dǎo)讀]2012年對(duì)許多人來說利用語音控制手機(jī)、汽車、電腦甚至是電視機(jī)都是非常平常的事了。之所以如此,是因?yàn)檎Z音識(shí)別和自然語言理解(NLU)領(lǐng)域取得了重大進(jìn)步。不久前還被認(rèn)為是科

2012年對(duì)許多人來說利用語音控制手機(jī)、汽車、電腦甚至是電視機(jī)都是非常平常的事了。之所以如此,是因?yàn)檎Z音識(shí)別和自然語言理解(NLU)領(lǐng)域取得了重大進(jìn)步。不久前還被認(rèn)為是科幻小說里才會(huì)出現(xiàn)的產(chǎn)品功能,現(xiàn)在已經(jīng)變成主流手機(jī)和消費(fèi)設(shè)備的基本功能。語音用戶界面和“虛擬個(gè)人助手”已經(jīng)成為福特、三星、蘋果和谷歌(微博)等企業(yè)開展廣告營銷活動(dòng)時(shí)重點(diǎn)宣傳的一個(gè)關(guān)鍵特色,這一特色將會(huì)引起前所未有的關(guān)注和市場需求。

人們對(duì)這些全新的語音驅(qū)動(dòng)用戶界面抱有很大的熱情。許多報(bào)道指出,用戶對(duì)他們的新“助手”充滿感情。不過,許多人也認(rèn)識(shí)到,這些系統(tǒng)仍在不斷改進(jìn)中,需要不斷的創(chuàng)新。預(yù)計(jì),現(xiàn)有的虛擬個(gè)人助手將演變成無處不在的智能系統(tǒng),通過語音、文本、視覺、觸覺和手勢與人進(jìn)行互動(dòng),并將基于周圍的環(huán)境信息,如位置等,讓所有互動(dòng)具有更大的相關(guān)性。

以下是對(duì)2013年智能系統(tǒng)發(fā)展的8點(diǎn)展望:

1、語音識(shí)別精度更高

語音識(shí)別是智能系統(tǒng)技術(shù)的基礎(chǔ),語音識(shí)別的準(zhǔn)確性一直在穩(wěn)步提高,之所以這么說,是因?yàn)楝F(xiàn)在已經(jīng)把更加豐富的訓(xùn)練數(shù)據(jù)、更加強(qiáng)大的計(jì)算能力以及全新更加復(fù)雜的建模方法(如目前非常流行的基于人腦如何完成模式識(shí)別的技術(shù)“深度信念網(wǎng)”( Deep Belief Networks))結(jié)合在一起,提高了語音識(shí)別的精度。

2、設(shè)備將具備更強(qiáng)的識(shí)別能力

不管是在城市街道上,還是在汽車?yán)锘蚩蛷d里,語音識(shí)別的功能性和精確性正越來越高。一流的信號(hào)處理能夠區(qū)分不同的聲音,語音生物統(tǒng)計(jì)學(xué)有助于判定誰在說話。并排的多個(gè)麥克風(fēng)能夠動(dòng)態(tài)引導(dǎo)“聽光束”,并可在攝像頭的輔助下跟蹤用戶的位置。因此,在與用戶聯(lián)系更加緊密的移動(dòng)設(shè)備上應(yīng)用這項(xiàng)功能,將會(huì)提高移動(dòng)設(shè)備的識(shí)別能力。

3、設(shè)備將具備更強(qiáng)的感知能力

未來完成一項(xiàng)任務(wù)可減少許多必需的步驟,如必須選擇設(shè)備、打開設(shè)備、找到目標(biāo)應(yīng)用、啟動(dòng)應(yīng)用,然后與應(yīng)用互動(dòng)。不久,用戶將可以簡單地用自然語言告訴處于睡眠狀態(tài)的設(shè)備干什么——不用觸碰它。具備這種低功耗模式狀態(tài)下聽功能的設(shè)備將可以鑒別用戶,并通過逐步喚醒其處理器的其他功能來確認(rèn)要求的操作,最終按照要求完成相應(yīng)的操作。

4、互動(dòng)性的普遍性和連續(xù)性

隨著語音識(shí)別技術(shù)和自然語言理解技術(shù)的發(fā)展,用戶希望能夠在不同設(shè)備(智能手機(jī)、平板電腦、電視或汽車)的顯示屏上進(jìn)行互動(dòng),并擁有一致的體驗(yàn)。用戶可以在一臺(tái)設(shè)備上開始任務(wù),在另一臺(tái)設(shè)備上完成任務(wù)。這種互動(dòng)將通過基于客戶識(shí)別器和云識(shí)別器,以及自然語言理解引擎的框架聯(lián)系在一起。用戶的互動(dòng)歷史將被聚合在云端,用來改進(jìn)識(shí)別模型,以便在其他所有相關(guān)設(shè)備中應(yīng)用。

5、自然語言處理和人工智能將更加智能化

自然語言理解(猜測用戶輸入并據(jù)此操作的意圖)的能力也在不斷提高。今天的一流技術(shù)把功能強(qiáng)大的語言框架(被稱作符號(hào)處理)、知識(shí)顯示法(知識(shí)本體)和利用大數(shù)據(jù)用觀察到的例子和模型來填充框架的機(jī)器學(xué)習(xí)結(jié)合在一起。這種互補(bǔ)性至關(guān)重要:過去的符號(hào)方法被證明是不可靠的,純數(shù)據(jù)驅(qū)動(dòng)型自然語言理解一般僅是膚淺的理解。

智能系統(tǒng)現(xiàn)在已從對(duì)任務(wù)目標(biāo)的預(yù)定程序描述遷移至以用戶的背景、參數(shù)選擇和互動(dòng)歷史為條件的動(dòng)態(tài)操作,系統(tǒng)據(jù)此有效地自我編程。這將允許我們從簡單的任務(wù)向更加復(fù)雜的任務(wù)過渡,可能必須訪問協(xié)調(diào)工作流中的各種應(yīng)用和信息源。

比如,為了響應(yīng)“核查下比爾(Bill)和艾利森(Allison)明天晚上是否來吃飯”的請(qǐng)求,手機(jī)個(gè)人助手將確定最喜愛的飯店,并基于通信歷史來決定你所說的是哪個(gè)比爾和艾利森,同時(shí)聯(lián)系對(duì)方的虛擬助手核對(duì)他們的安排,并草擬一份有關(guān)預(yù)定和人員組成等信息的電子郵件發(fā)給對(duì)方。

這種推理屬于人工智能范疇,不過,早期系統(tǒng)可靠性差,新一代系統(tǒng)將依靠一種被稱為“非單調(diào)推理”的更加靈活和穩(wěn)健的方法,在模糊狀態(tài)下表現(xiàn)更好,并生成近似的解決方案,盡管可能無法給出準(zhǔn)確的解決方案。

6、語義搜索將直接訪問信息

理解用戶意圖可以穿過多個(gè)屏幕的應(yīng)用圖標(biāo)、文件夾和子文件夾,或一系列中間網(wǎng)頁。在搜索方面,頻繁提問的自然語言理解應(yīng)用可以跳過搜索引擎檢索的所有象征性鏈接列表,直接導(dǎo)向希望的目的地。這種快速和直接訪問信息的功能非常強(qiáng)大,潛在地威脅到普通的搜索業(yè)務(wù)。一些搜索服務(wù)提供商也開始測試用直接應(yīng)答提問來替代網(wǎng)頁鏈接,不過,他們現(xiàn)在還不允許用戶直接獲取想要的第三方內(nèi)容。

7、用戶關(guān)注虛擬助手

用戶服務(wù)業(yè)務(wù)很難按照有效和可理解的方式組織成菜單結(jié)構(gòu)——不管是在互動(dòng)語音應(yīng)答(IVR)系統(tǒng),還是在移動(dòng)應(yīng)用中。專業(yè)化虛擬助手的自然語言理解將完全繞開互動(dòng)語音應(yīng)答系統(tǒng)直接訪問信息,此外還將支持靈活的對(duì)話,允許用戶前瞻性地提供未受提示的信息,任意在不同聯(lián)系中心功能間切換。

8、自然語言理解將改進(jìn)醫(yī)療保健

醫(yī)師利用語音識(shí)別系統(tǒng)來描述包含大量關(guān)鍵信息的接診患者病情,但這很難實(shí)現(xiàn)共享。利用自然語言理解應(yīng)用,與醫(yī)學(xué)有關(guān)的事實(shí)將被篩選并被輸入電子健康記錄數(shù)據(jù)庫。自動(dòng)化事實(shí)篩選的精度現(xiàn)在已經(jīng)接近人工操作,使得系統(tǒng)可以幫助醫(yī)師“說清”患者的病情。改進(jìn)的患者信息記錄能被進(jìn)一步處理,以分配帳單代碼,節(jié)約成本,提高信息和護(hù)理的質(zhì)量。

綜合利用這些進(jìn)步表明新一代計(jì)算——第三代計(jì)算革命的開始,意義相當(dāng)于引入圖形和觸摸用戶界面。自然語言理解和人工智能在設(shè)備功耗管理、快速網(wǎng)絡(luò)以及基于云的內(nèi)容、服務(wù)和應(yīng)用領(lǐng)域取得了長足的進(jìn)步,并發(fā)揮了巨大作用。

2013年將是智能系統(tǒng)年,期待著那些夢(mèng)幻般的智能應(yīng)用能夠盡快變成現(xiàn)實(shí)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉