人工智能的發(fā)展 為人類(lèi)社會(huì)的進(jìn)步提供了平臺(tái)
眾所周知,AI將是推動(dòng)未來(lái)社會(huì)發(fā)展的主力。不久前的10月21日,便有第六屆世界互聯(lián)網(wǎng)大會(huì)的重要產(chǎn)業(yè)合作對(duì)接活動(dòng)——IDG“AI+5G 賦能科技 引領(lǐng)未來(lái)”專(zhuān)場(chǎng)活動(dòng)在烏鎮(zhèn)互聯(lián)網(wǎng)國(guó)際會(huì)展中心舉行。其以“AI+5G 賦能科技 引領(lǐng)未來(lái)”為主題,齊聚行業(yè)大咖,共同探討在5G時(shí)代,人工智能的發(fā)展之路,為促進(jìn)行業(yè)交流、實(shí)現(xiàn)產(chǎn)業(yè)合作提供平臺(tái)。
縱觀現(xiàn)在的國(guó)際市場(chǎng),外有日本軟銀的孫正義,為了發(fā)展AI成立1000億美金的AI基金,專(zhuān)門(mén)投資一些AI領(lǐng)域的公司。內(nèi)則有如曠視科技、極鏈科技等AI產(chǎn)業(yè)獨(dú)角獸,積極進(jìn)取,開(kāi)拓新領(lǐng)域。這些都體現(xiàn)出了AI在人們心中地位的加重。
可也有不少人對(duì)AI產(chǎn)生了質(zhì)疑聲,畢竟目前的電腦程序以及所謂的AI,其對(duì)我們?nèi)祟?lèi)的自然語(yǔ)言只是達(dá)到處理的級(jí)別。這方面的專(zhuān)業(yè)叫法是自然語(yǔ)言處理NLP,還遠(yuǎn)遠(yuǎn)達(dá)不到我們期望的自然語(yǔ)言理解的程度。
它的實(shí)現(xiàn)方式是,從海量的人類(lèi)自然語(yǔ)言素材里面,統(tǒng)計(jì)出詞與詞,字與字,以及詞組成的短語(yǔ)的模式和出現(xiàn)頻率,然后根據(jù)這個(gè)頻率統(tǒng)計(jì),再結(jié)合一段文字上下文邏輯的簡(jiǎn)短推理,來(lái)找出統(tǒng)計(jì)概率最大的結(jié)果。再把這個(gè)結(jié)果作為答案輸出或者根據(jù)這個(gè)結(jié)果尋找統(tǒng)計(jì)概率最大的匹配答案。
這樣的運(yùn)作模式和我們?nèi)祟?lèi)理解自然語(yǔ)言的方式有一定的相似,但缺失了很重要的一部分,即詞語(yǔ)背后所指代的事物的背景知識(shí),而這才是理解人類(lèi)自然的關(guān)鍵,所以現(xiàn)在AI界的一個(gè)重要挑戰(zhàn)是,如何讓計(jì)算機(jī)理解我們?nèi)祟?lèi)掌握的公共知識(shí),也就是常識(shí)。
近期,微軟研究團(tuán)隊(duì)便通過(guò)對(duì)上下文建模加以研究,得出了一種新的方法。這種方法能夠讓 AI 模型通過(guò)上下文的歷史記錄來(lái)改寫(xiě)對(duì)話(huà)中的最后話(huà)語(yǔ)。在一份預(yù)先出版的論文中,微軟研究團(tuán)隊(duì)詳細(xì)地介紹了他們的工作——為開(kāi)放領(lǐng)域的對(duì)話(huà)進(jìn)行無(wú)監(jiān)督的上下文重寫(xiě)。他們聲稱(chēng),在重寫(xiě)質(zhì)量和多輪響應(yīng)生成方面,他們的實(shí)驗(yàn)結(jié)果已經(jīng)達(dá)到了最新基準(zhǔn)。
正如研究人員所解釋的那樣,對(duì)話(huà)上下文提出了句子建模中所沒(méi)有的挑戰(zhàn),比如主題轉(zhuǎn)換、共同引用(像他、她、它、他們這種)、長(zhǎng)期依賴(lài)。大多數(shù)系統(tǒng)解決這些問(wèn)題的方法是在最后一段話(huà)中添加關(guān)鍵字,或者用 AI 模型學(xué)習(xí)數(shù)字表示,但這種方法往往會(huì)遇到障礙,比如無(wú)法選擇正確的關(guān)鍵詞、無(wú)法處理較長(zhǎng)的上下文等。
這時(shí)候,就是微軟研究團(tuán)隊(duì)的方法的用武之地了。它通過(guò)對(duì)語(yǔ)境信息的考量,重新制定了對(duì)話(huà)中的最后一句話(huà);這么做是為了生成一個(gè)獨(dú)立的話(huà)語(yǔ),既不存在相互參照,也不依賴(lài)過(guò)去對(duì)話(huà)的其它話(huà)語(yǔ)。
舉個(gè)例子,如果將“我討厭喝咖啡。- - 為什么?它挺好喝的啊?!鞭D(zhuǎn)化成“為什么會(huì)討厭喝咖啡呢?它挺好喝的啊?!?,這就借用了“它”和“為什么”。其中,“它”指代的是對(duì)話(huà)中提到的咖啡,“為什么”則是“為什么討厭喝咖啡”的縮寫(xiě)形式。
對(duì)此,研究人員設(shè)計(jì)了一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)——上下文重寫(xiě)網(wǎng)絡(luò),來(lái)實(shí)現(xiàn)端到端的流程自動(dòng)化。這個(gè)系統(tǒng)是由一個(gè)序列到序列模型組成的,它能夠?qū)⒐潭ㄩL(zhǎng)度的話(huà)語(yǔ)映射到固定長(zhǎng)度的重寫(xiě)句子上。并且,它還具有一個(gè)獨(dú)立的注意力機(jī)制,這個(gè)機(jī)制能夠通過(guò)最后話(huà)語(yǔ)中的不同單詞來(lái)幫助它從上下文中復(fù)制單詞。
微軟研究團(tuán)隊(duì)認(rèn)為,他們的工作朝著更易解釋和更易控制的上下文建模中邁進(jìn)了一步。另外,該研究團(tuán)隊(duì)還表示,他們的模型可以從嘈雜的語(yǔ)境中提取出重要的關(guān)鍵詞,然后將這些關(guān)鍵詞插入到最后的話(huà)語(yǔ)中,使其不僅變得易于控制和解釋?zhuān)€有助于將信息直接傳遞到最后的話(huà)語(yǔ)中。
這個(gè)技術(shù)可以幫助人工智能在真正理解人類(lèi)話(huà)語(yǔ)的路上跨出一步,盡管該模型在強(qiáng)化學(xué)習(xí)后偶爾會(huì)變得不穩(wěn)定,不過(guò)它依舊顯著地提升了話(huà)語(yǔ)的多樣性。此外,微軟今年推出了一款可以識(shí)別情緒的工具,根據(jù)上傳的圖片就可以分析出情緒特征,但同時(shí)微軟也聲明目前這款軟件還只是以?shī)蕵?lè)為主,還不能每次都能正確的識(shí)別情緒。
“情緒的產(chǎn)生過(guò)程會(huì)反映在外周器官狀態(tài)變化。比如人受到外界刺激感到恐懼的時(shí)候,會(huì)出現(xiàn)心跳加速或心律不齊、呼吸短促或停頓和血壓升高等情況。目前,AI深度學(xué)習(xí)的情緒識(shí)別已經(jīng)從快樂(lè)、驚訝、憤怒、悲傷、恐懼和厭惡等基本情緒發(fā)展到了超過(guò)二十種更微妙的情緒,例如“愉快的驚訝”、“憤怒的驚訝”、敬畏等。
不可否認(rèn),未來(lái)已經(jīng)離我們不遠(yuǎn)了。無(wú)論我們喜不喜歡、樂(lè)不樂(lè)意,終有一天AI將能真正讀懂人類(lèi)的語(yǔ)言、動(dòng)作、情緒等各類(lèi)因素。屆時(shí),如何處理好其間可能存在的問(wèn)題,還需我們提前進(jìn)行思考。
正如研究人員所解釋的那樣,對(duì)話(huà)上下文提出了句子建模中所沒(méi)有的挑戰(zhàn),比如主題轉(zhuǎn)換、共同引用(像他、她、它、他們這種)、長(zhǎng)期依賴(lài)。大多數(shù)系統(tǒng)解決這些問(wèn)題的方法是在最后一段話(huà)中添加關(guān)鍵字,或者用 AI 模型學(xué)習(xí)數(shù)字表示,但這種方法往往會(huì)遇到障礙,比如無(wú)法選擇正確的關(guān)鍵詞、無(wú)法處理較長(zhǎng)的上下文等。
這時(shí)候,就是微軟研究團(tuán)隊(duì)的方法的用武之地了。它通過(guò)對(duì)語(yǔ)境信息的考量,重新制定了對(duì)話(huà)中的最后一句話(huà);這么做是為了生成一個(gè)獨(dú)立的話(huà)語(yǔ),既不存在相互參照,也不依賴(lài)過(guò)去對(duì)話(huà)的其它話(huà)語(yǔ)。
舉個(gè)例子,如果將“我討厭喝咖啡。- - 為什么?它挺好喝的啊?!鞭D(zhuǎn)化成“為什么會(huì)討厭喝咖啡呢?它挺好喝的啊?!?,這就借用了“它”和“為什么”。其中,“它”指代的是對(duì)話(huà)中提到的咖啡,“為什么”則是“為什么討厭喝咖啡”的縮寫(xiě)形式。
對(duì)此,研究人員設(shè)計(jì)了一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)——上下文重寫(xiě)網(wǎng)絡(luò),來(lái)實(shí)現(xiàn)端到端的流程自動(dòng)化。這個(gè)系統(tǒng)是由一個(gè)序列到序列模型組成的,它能夠?qū)⒐潭ㄩL(zhǎng)度的話(huà)語(yǔ)映射到固定長(zhǎng)度的重寫(xiě)句子上。并且,它還具有一個(gè)獨(dú)立的注意力機(jī)制,這個(gè)機(jī)制能夠通過(guò)最后話(huà)語(yǔ)中的不同單詞來(lái)幫助它從上下文中復(fù)制單詞。
微軟研究團(tuán)隊(duì)認(rèn)為,他們的工作朝著更易解釋和更易控制的上下文建模中邁進(jìn)了一步。另外,該研究團(tuán)隊(duì)還表示,他們的模型可以從嘈雜的語(yǔ)境中提取出重要的關(guān)鍵詞,然后將這些關(guān)鍵詞插入到最后的話(huà)語(yǔ)中,使其不僅變得易于控制和解釋?zhuān)€有助于將信息直接傳遞到最后的話(huà)語(yǔ)中。
這個(gè)技術(shù)可以幫助人工智能在真正理解人類(lèi)話(huà)語(yǔ)的路上跨出一步,盡管該模型在強(qiáng)化學(xué)習(xí)后偶爾會(huì)變得不穩(wěn)定,不過(guò)它依舊顯著地提升了話(huà)語(yǔ)的多樣性。此外,微軟今年推出了一款可以識(shí)別情緒的工具,根據(jù)上傳的圖片就可以分析出情緒特征,但同時(shí)微軟也聲明目前這款軟件還只是以?shī)蕵?lè)為主,還不能每次都能正確的識(shí)別情緒。