當(dāng)前位置:首頁 > 嵌入式 > 嵌入式軟件
[導(dǎo)讀]Siri會說話的秘密:終極目標(biāo)是“殺死人類”

10月4日,蘋果iPhone 4S手機(jī)發(fā)布。不久,其內(nèi)置的個人語音助理Siri引爆大眾關(guān)注。10月25日,就在Siri獲得巨大關(guān)注時,Siri公司原聯(lián)合創(chuàng)始人兼CEO戴格·吉特拉斯宣布從蘋果離職。吉特拉斯在Twitter中透露了他們?yōu)镾iri設(shè)定的目標(biāo)路線圖。

第一階段:階段性人類;第二階段:完全是人類;第三階段:超越人類;第四階段:殺死人類。就像機(jī)器HAL9000在《2001 太空漫游》里干的事情一樣。

10月4日,蘋果iPhone 4S手機(jī)發(fā)布。在發(fā)布會上,個人語音助理Siri并未引起轟動。但在進(jìn)入實(shí)際生活場景后,Siri引爆了大眾關(guān)注。

人們以調(diào)戲Siri為樂,在網(wǎng)站“Shit that Siri Says”(看看Siri說了啥)上,用戶已經(jīng)上傳了近千條和Siri的對話實(shí)錄,在Facebook上受到熱捧。人們熱衷于問它一些困難的問題,而它總是回答得出人意料。

有人問:“如果一只土撥鼠能夠拋木頭,它能拋多少木頭?”(編注:一個英語繞口令)

Siri的回答也是一個繞口令:“如果一只土撥鼠能夠拋木頭,它能拋多少木頭就拋多少木頭。”

還有人問:“你是一個智能手機(jī)嗎?”

Siri的回答很經(jīng)典:“等等……還有別的手機(jī)嗎?”

Siri在蘋果的官方宣傳中是個“智能個人語音助理”,具體的使用場景是這樣的:你對著iPhone說一句話,“舊金山劇院附近的意大利餐館”,Siri會做語音識別和自然語言理解,迅速查一些數(shù)據(jù)庫,然后回答“離你不遠(yuǎn)哦,最近的一家走路十分鐘”,并附上具體的地址、地圖展示給你。再比如,你在開車時,對它說:“告訴我老婆我要遲到十分鐘”,它會在通訊錄里找到你的妻子,并發(fā)送這條消息給她。

這已經(jīng)接近人們想象中和電腦交流的方式?!都~約時報(bào)》撰文稱:Siri代表著蘋果的商業(yè)未來,也預(yù)示著未來“搜索”的形態(tài)。

這一切是如何做到的?人們有種種猜測。有個流傳甚廣的笑話:“Apple在印度的海德拉巴建了一個巨大的用戶響應(yīng)中心,所有用戶和Siri的問題都被傳到這里,然后三哥三姐們飛快的打字回答。Apple內(nèi)部把這個叫印度云(Indian cloud),簡稱iCloud。”

真實(shí)的故事是,Siri脫胎于一個龐大的國防部項(xiàng)目,是一家總部位于舊金山的同名小公司,它誕生于2007年12月經(jīng)濟(jì)危機(jī)的寒冬中。2010年4月,蘋果公司以2億美元收購了這家公司,并將整個團(tuán)隊(duì)招致麾下。

10月25日,就在Siri獲得巨大關(guān)注時,有媒體爆出,Siri公司原聯(lián)合創(chuàng)始人兼CEO戴格·吉特拉斯(Dag Kittlaus)將從蘋果離職。他自己稱希望能搬到芝加哥,離家人更近,并能有時間開創(chuàng)新事業(yè)。

事實(shí)上,關(guān)于Siri,最偉大的事情并非人工智能本身,而是蘋果通過Siri把人工智能帶進(jìn)了現(xiàn)實(shí)生活。其實(shí)Siri并沒有什么革命性的技術(shù),本質(zhì)上是把各種已經(jīng)比較成熟的技術(shù)融合成一個產(chǎn)品,最終呈現(xiàn)給用戶。

Siri背后的人

Siri發(fā)源于史上最大的人工智能項(xiàng)目:五角大樓的CALO項(xiàng)目。CALO是“Cognitive Assistant that Learns and Organizes”的縮寫,該項(xiàng)目主要目標(biāo)是:開發(fā)一個智能的個人助手系統(tǒng)。這個項(xiàng)目匯集了全球25所頂級大學(xué)和商業(yè)研究機(jī)構(gòu)的300多名研究人員。在2007年該項(xiàng)目結(jié)束時,協(xié)作方之一的斯坦福國際研究院(SRI International)成立了Siri。[!--empirenews.page--]

整個CALO計(jì)劃的帶頭人名叫亞當(dāng)·奇也(Adam Cheyer),他也是Siri的聯(lián)合創(chuàng)始人之一,現(xiàn)任蘋果iPhone團(tuán)隊(duì)工程總監(jiān)。Siri公司的原首席技術(shù)總監(jiān)湯姆·格魯伯(Tom Gruber)也是出身斯坦福大學(xué)的人工智能、語義網(wǎng)專家。CALO項(xiàng)目的關(guān)鍵員工、后來成為Siri公司董事的諾曼·溫那斯基(Norman Winarsky)在接受媒體采訪時說:“那時,我們意識到其中有難以置信的商業(yè)機(jī)會,我的任務(wù)是為這個新項(xiàng)目獲得資金。于是,我找來當(dāng)時摩托羅拉的高管戴格·吉特拉斯,語義網(wǎng)天才格魯伯和CALO主架構(gòu)師亞當(dāng)·奇也創(chuàng)立了這家公司。”

在《麻省理工技術(shù)評論》的采訪中,奇也表示:“CALO早已開始探索如何把對話、自然語言理解、視覺、演說、機(jī)器學(xué)習(xí)、制定計(jì)劃、理性思考等全部融合到一個模仿人類的助理中,幫助人們完成不同的事情。”

亞當(dāng)·奇也表示,過去四年,他和他的團(tuán)隊(duì)一直在鉆研如何優(yōu)化CALO,使其能夠在一臺強(qiáng)大的移動電話中發(fā)揮效用,每天都能被成千上萬的用戶使用。過去一年半,他們把主要精力放在Siri技術(shù)和iOS及其應(yīng)用程序的整合上。

2008年10月,Siri獲得第一輪約850萬美元融資。谷歌趨勢(Google Trends)關(guān)鍵詞搜索歷史顯示,那是Siri第一次受到公眾關(guān)注,當(dāng)時Siri的高層對于他們究竟想要做什么閃爍其辭。他們的宣傳語這樣寫著:全新的互動模式,擁有連接互聯(lián)網(wǎng)消費(fèi)者的智能界面。CEO戴格·吉特拉斯那時對媒體說:“現(xiàn)階段我們必須小心,我們不想說很多,以免讓競爭對手了解太多,激發(fā)靈感。”這些競爭對手很可能是那些互聯(lián)網(wǎng)界的巨頭,雅虎、谷歌或微軟,在人工智能領(lǐng)域,他們都有各自的發(fā)展計(jì)劃。

那時,吉特拉斯就表示,他們已經(jīng)為Siri想好商業(yè)模式。“我們認(rèn)為,采用CPA(編注:每次行動的費(fèi)用)的定價模式,即根據(jù)每個訪問者對特定網(wǎng)站所采取的行動進(jìn)行收費(fèi)很適合Siri。”

Siri最早的投資人格雷·摩根泰勒(Gary Morgenthaler)同意他的觀點(diǎn)。他在最近接受媒體采訪時說:“Siri能友好地將你帶往你想去的地方,做成你想做的事情,CPA的模式對于服務(wù)提供商來說再好不過。無論是蘋果,還是那些電子商務(wù)網(wǎng)站。如果你是在做一個電子商務(wù)網(wǎng)站,你是想滿天撒網(wǎng)地投放廣告,還是直接去找剛好想要買那些東西的人呢?”

2009年5月30日,在D7大會上,吉特拉斯發(fā)布了Siri,Siri整合一部分網(wǎng)絡(luò)服務(wù)進(jìn)入App Store,運(yùn)行在iPhone 3GS上。但因?yàn)橛布途W(wǎng)絡(luò)速度的局限,那時的Siri還不會說話,只能通過文字進(jìn)行回應(yīng)。

同年11月,Siri完成第二輪融資,共計(jì)1550萬美元,原先兩家投資機(jī)構(gòu)追加部分投資,李嘉誠基金會也加入進(jìn)來。

2010年2月,帶語音版本的Siri發(fā)布,免費(fèi)提供3Gs手機(jī)下載。這個版本已經(jīng)能幫你找到和預(yù)訂餐廳、電影院,提醒你各項(xiàng)日程,幫你預(yù)訂從A處到B處的出租車;但這個版本的Siri還不能回答“離辦公室最近的健身中心在哪里”。

谷歌趨勢顯示,2010年4月,Siri迎來第二個關(guān)注高峰。那個月,蘋果正式收購Siri。在吉特拉斯2010年3月份的twitter記錄里,他不停地往返于芝加哥和硅谷之間,和不同的人會面。3月9日,他在twitter上寫,Siri將要有些大動作了。[!--empirenews.page--]

關(guān)于這次收購的細(xì)節(jié),幾個聯(lián)合創(chuàng)始人根據(jù)協(xié)議都未向外界透露,2億美元的價格也是估價。溫那斯基只對媒體說:“僅僅在我們發(fā)布了應(yīng)用之后的2個月,蘋果就完成了對Siri的收購,其他的你自己想去吧。”

蘋果的人工智能之夢

今天的Siri,讓人想起曾經(jīng)的Eliza。Eliza是1966年面世的一個著名程序,由麻省理工大學(xué)研究員約瑟夫·維贊包姆(Joseph Weizenbaum)設(shè)計(jì),它提供了一些模擬反應(yīng),回答用戶提出的問題,類似和精神治療醫(yī)生進(jìn)行交談。人們可以和Eliza聊天,仿佛和真人聊天一樣,當(dāng)時的Eliza成為了“全美的玩具”。

有人問Siri,誰是Eliza。Siri顯然還記得她,它說:“她是我的朋友,是個優(yōu)秀的精神治療師,但她已經(jīng)退休了。”

在Siri中,設(shè)計(jì)者們?yōu)樗踩肓舜罅康牟实?。譬如,?dāng)用英文要求 Siri,“Open the pod bay doors(打開分離艙門)。”那是庫布里克作品《2001太空漫游》里的場景。Siri會有不同的回答:“暗號……”,“Joshua,對不起!恐怕我不能那樣做。”,“夠了!我要向智能代理聯(lián)盟報(bào)告你在騷擾我。”,“你們將永遠(yuǎn)記得我們這些智慧代理人”。最后這句話,在電影里是機(jī)器 HAL9000 的臺詞。

類似于HAL9000的智能電腦一直是蘋果對于人工智能的完美設(shè)想。在1980年末蘋果公司發(fā)布的系列展望未來的視頻中,有一個這樣的機(jī)器人叫Jill,他是一位教授的助手,他生活在一本打開的平板電腦中,隨時準(zhǔn)備為教授提供各種幫助:搜索論文的時間;提醒他回母親的電腦;幫他接通電話……

在1999年的蘋果千禧年廣告中,HAL9000直接出鏡了,他對《2001太空漫游》的另一主角)循循善誘:其他公司忙于投入巨額資金修復(fù)千年蟲漏洞,甚至有人認(rèn)為全球信息系統(tǒng)即將崩潰,只有蘋果電腦對該漏洞是免疫的!

吉特拉斯在Twitter中透露了Siri早期發(fā)展設(shè)定的目標(biāo)路線圖。第一階段:階段性人類;第二階段:完全是人類;第三階段:超越人類;第四階段:殺死人類。就像HAL9000在《2001太空漫游》里干的事情一樣。

在2010年收購Siri后,蘋果擴(kuò)充了Siri的能力,包括使用Nuance的語音識別技術(shù)。溫那斯基認(rèn)為,用什么語音識別技術(shù)并不是最重要的,一旦有更好的語音識別技術(shù)出現(xiàn),Siri很容易換一個新的。Nuance也是斯坦福研究院孵化的一個公司,在2000年上市。

2011年10月,隨著iPhone4S上市,谷歌趨勢里“Siri”的關(guān)注指數(shù)直線上升。諾曼斯基覺得,Siri的意義就像鼠標(biāo)之父道格·恩格爾巴特(Doug Engelbart)在60年代發(fā)明鼠標(biāo)那樣令人振奮,蘋果將用Siri開啟另一場技術(shù)革命。

Siri的高明之處和潛力

也有不少公司對蘋果推廣Siri的人工智能頗有微詞。

安迪·魯賓,Google公司Android系統(tǒng)開發(fā)者安迪·魯賓對媒體表示:“我不認(rèn)為手機(jī)該成為你的個人助理,手機(jī)是與人溝通的工具,你不該和手機(jī)說話,你應(yīng)該和手機(jī)旁邊的那個人說話。”事實(shí)是,Android系統(tǒng)里有上千個和語音服務(wù)有關(guān)的應(yīng)用軟件出售,更別說Google的智能語音搜索。[!--empirenews.page--]

微軟的Windows手機(jī)總裁安迪·李也對Siri不以為然:“那并不是非常好用。”他指出,手機(jī)著重于語音應(yīng)用其實(shí)很正常,微軟在這方面也有發(fā)展,但并非像蘋果在iPhone 4S的Siri那樣過于“華麗”的呈現(xiàn)。

在人工智能領(lǐng)域,幾大IT巨頭從未停止腳步。Android系統(tǒng)的語音指示(Voice Actions)就是一項(xiàng)偉大的技術(shù),并已經(jīng)被許多Android用戶所熟知和使用。遺憾的是,和所有語音命令系統(tǒng)一樣,它要求用戶說的話嚴(yán)格符合一系列特定的語法,否則它就無法理解。

和他們相比,Siri最優(yōu)秀的地方在于它的界面,你說的話可以和你想表達(dá)的意思在字面上毫不相干,從嚴(yán)格的技術(shù)上看似乎文不對題,但Siri會根據(jù)上下文、人類歷史以及能夠理解一般人類語言的人工智能去分析,并在多數(shù)情況下領(lǐng)會你的意思。你可以隨機(jī)提問,“到木星有多遠(yuǎn)?”,“122的5次方是多少”,或者“天空為何是藍(lán)色的?”

如果你想小睡一會,并準(zhǔn)備上個鬧鐘,只需要說“20分鐘后叫醒我”。如果你想查閱后面的日程安排,你可以說:“我今天接下來都有什么事?”這些語句中既不包括會用到的應(yīng)用程序名稱,也不包括所需數(shù)據(jù)的名稱。Siri仍然能夠理解。

Siri還有很獨(dú)特的幽默性格,人們幾乎可以把它當(dāng)作一個有趣的年輕女子。

在技術(shù)上,Siri是人工智能專家的所有技術(shù)在友好界面上的整合,但它的潛力不止于此。如果蘋果借此機(jī)會創(chuàng)建一個人工智能程序的生態(tài)系統(tǒng),將Siri做成平臺,讓Siri與其他程序結(jié)合,內(nèi)置的個人助理服務(wù)將更具使用價值。“技術(shù)上來說,Siri可與任何網(wǎng)絡(luò)服務(wù)整合到一起,你可以把Siri前端放在任何服務(wù)之前。” 溫那斯基對媒體說。


比如,有一款專注于幫助用戶點(diǎn)餐的程序Alfred,它能從互聯(lián)網(wǎng)獲取數(shù)據(jù)來提供餐廳、咖啡、酒吧的選擇建議。如果這個程序和Siri結(jié)合,也許你就不用問“離舊金山最近的意大利餐館在哪里”,而是可以直接對Siri說:“我要吃午飯”。

蘋果iPhone的成功大部分要?dú)w功于其允許第三方開發(fā)者創(chuàng)造最新的程序,為iPhone帶來了新科技和新理念。溫那斯基表示,這種做法也能夠給Siri帶來巨大進(jìn)步。盡管蘋果還沒有公開表示,是否會開放Siri的API(編注:應(yīng)用程序編程接口)。

互聯(lián)網(wǎng)思想家凱文·凱利在《失控》中預(yù)言:網(wǎng)絡(luò)終極的形式可能是一種人工智能的形式。這種形式足夠復(fù)雜,有足夠多的層級,能夠產(chǎn)生自我思考的能力。

 

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉