人工智能與記憶力賽跑 加強沉浸式語言學(xué)習(xí)體驗
最近,語言學(xué)習(xí)軟件Duolingo的AI研究負責(zé)人Burr Settles,對他們?nèi)绾芜\用人工智能為用戶制定個性化的學(xué)習(xí)課程進行了詳細介紹,主要包括數(shù)據(jù)跟蹤、統(tǒng)計模型、技能人才和沉浸式體驗四個方面。Duolingo是一款跨平臺應(yīng)用,用戶可以通過該平臺游戲化和小規(guī)模的課程,學(xué)會閱讀、傾聽和說幾十種語言,包括漢語、印地語和阿拉伯語,甚至像克林貢語這樣的虛構(gòu)方言。
目前,Duolingo在全球擁有3億用戶,并籌集了超過1億美元的資金,市場估值約為7億美元,其中知名支持者包括Alphabet的CapitalG和Kleiner Perkins。近日,外媒VentureBeat在倫敦舉行的人工智能峰會上,對Burr Settles進行了采訪。Settles表示,Duolingo人工智能戰(zhàn)略的核心是盡可能接近人與人之間的體驗。
如今,許多像Duolingo這樣的公司已經(jīng)利用智能手機的普及和無處不在的網(wǎng)絡(luò)連接,為世界各地的用戶們提供語言學(xué)習(xí)服務(wù)。據(jù)市場研究公司的數(shù)據(jù)顯示,2018年全球在線語言學(xué)習(xí)市場的規(guī)模達到了90億美元,2026年有可能超過200億美元。在此背景下,Duolingo一直在投資人工智能和機器學(xué)習(xí),做到像人類教師一樣為每個人量身定制自動化課程。
Settles在美國卡耐基梅隆大學(xué)(Carnegie Mellon University)擔(dān)任博士后研究科學(xué)家后,于2013年加入Duolingo,負責(zé)從前端到后端的所有工作。在加入Duolingo不久后,Settles和團隊就開始尋找改變Duolingo學(xué)習(xí)模型構(gòu)建模塊的方法,這些模型基于70年代的閃存卡調(diào)度算法。Settles表示,這項工作的挑戰(zhàn)之一,是那些利用人工智能進行實際教育的機構(gòu)很少。但Duolingo擁有大量的學(xué)習(xí)數(shù)據(jù),可以用來從頭開發(fā)新的模型和算法。
Settles還表示,他接受這份工作的部分原因是數(shù)據(jù)量、數(shù)據(jù)類型和數(shù)據(jù)的唯一性。他和團隊一直用啟發(fā)式方法,收集關(guān)于學(xué)生們做語言練習(xí)和練習(xí)時長的數(shù)據(jù),并嘗試創(chuàng)建預(yù)測模型來跟蹤這些統(tǒng)計數(shù)據(jù)。由于對用戶數(shù)據(jù)統(tǒng)計和跟蹤的需求,Duolingo一直在開發(fā)自己的統(tǒng)計和機器學(xué)習(xí)模型,并結(jié)合了像間隔重復(fù)的學(xué)習(xí)技術(shù),以優(yōu)化和提供個性化課程。
間隔重復(fù)的理論是,用戶間隔重復(fù)短課比在短時間內(nèi)填滿相同的信息效果要更好。與此相關(guān)的是“滯后效應(yīng)”,如果練習(xí)課之間的間隔次數(shù)逐漸增加,用戶的學(xué)習(xí)效果將能進一步提高。但是,系統(tǒng)自動提供語言學(xué)習(xí)課程的主要問題是,用戶現(xiàn)有的語言知識、個人情況和性情差異很大,機器學(xué)習(xí)模型往往是二元的,難以考慮到個體的細微差別。
這就是Duolingo“半衰期回歸”統(tǒng)計模型的來源,該模型能分析數(shù)百萬語言學(xué)習(xí)用戶的錯誤模式,以預(yù)測個人長期記憶中每個單詞的“半衰期”。在語言學(xué)習(xí)中,半衰期指人們腦中的詞匯或語法知識。如果人們一天都沒有練習(xí)新語言,那么它有50%的機會忘記這一課。因此,“半衰期回歸”就是系統(tǒng)深入一個人的大腦,弄清楚人們知道什么或不知道什么,并針對性地制定課程。
Settles發(fā)現(xiàn),當(dāng)他們將“半衰期回歸”統(tǒng)計模型投入使用時,用戶的參與度提高了12%。另外,定位內(nèi)容的方法很重要,例如,像人類教師一樣考慮對學(xué)生受半衰期回歸的影響。但內(nèi)容本身也同樣重要,因此Duolingoy也轉(zhuǎn)向人工智能,幫助團隊建立適合不同用戶的內(nèi)容課程。
對此,Settles表示:“英語中有數(shù)百萬個單詞,也許有10000個高頻詞,你教他們的順序是什么?你怎么把它們串在一起?”于是他們建立了一套系統(tǒng),以幫助內(nèi)容創(chuàng)作者制定初級、中級和高級材料。還有一個挑戰(zhàn)是,盡管Duolingo只有40%的用戶在學(xué)習(xí)英語,但公司用來訓(xùn)練人工智能系統(tǒng)的大部分教學(xué)數(shù)據(jù),都是為英語開發(fā)的。
因此,Duolingo需要將它的系統(tǒng)移植到其他語言上,稱為遷移學(xué)習(xí)(Transfer Learning)。目前,盡管人才儲備在緩慢增長,但AI技能人才依舊短缺,許多大型科技公司一直在努力收購有潛力的人工智能創(chuàng)企。人才短缺也是Duolingo在過去幾年中遇到的挑戰(zhàn),尤其是它關(guān)注人才的特定技能組合。它的人工智能研究跨越了一系列學(xué)科,除了語言和語言學(xué)外,還涉及心理學(xué)和學(xué)習(xí)科學(xué)。
Settle表示,他們希望能擁有更多擅長語言、人工智能和認知科學(xué)三門學(xué)科的交叉型人才。他們的標(biāo)準(zhǔn)很高,在申請AI工作的人中,能一路過關(guān)斬將通過的不超過0.5%。在過去18個月左右的時間里,Duolingo發(fā)現(xiàn)合格人才的興趣略有增長,其中包括來自其他科技公司和學(xué)術(shù)界的申請人。對此,Settle表示,有相當(dāng)多人來自較大的科技公司,他們也直接從博士項目中招聘了很多新人,主要原因是他們的思想較為開放,并且還沒有被制度化。
遠程教授語言最大的挑戰(zhàn)之一是,很難創(chuàng)造出一種吸引人且充滿沉浸感的學(xué)習(xí)體驗,讓學(xué)生保持學(xué)習(xí)。為了提高參與度,Duolingo在2016年推出了一款聊天機器人,能通過應(yīng)用程序中的文本和學(xué)生自動對話,幫助教授語言。不同機器人的角色能夠?qū)σ幌盗胁淮_定的答案做出各種反應(yīng),如果用戶卡住了,可以點擊“幫我回復(fù)”按鈕。目前,Duolingo的機器人似乎暫時被官方刪除,但這種自動化的學(xué)習(xí)取代了人類教師,將虛擬教學(xué)提升到了一個新的水平。
如果將虛擬現(xiàn)實(VR)融入教學(xué)中,用戶可以帶上耳機進入虛擬教室,學(xué)習(xí)一門新語言就會變得更有吸引力。針對Duolingo將來是否會使用VR沉浸式教學(xué)的這一問題,Settle表示這是有可能的,公司似乎很清楚這些新興技術(shù)將帶來的好處,并且沉浸式教學(xué)的潛力也許是巨大的。目前,Duolingo沒有透露任何關(guān)于智能語音助手集成或沉浸式視覺教學(xué)的計劃,但它將進一步讓語言學(xué)習(xí)內(nèi)容和交付更具個性化,努力將人的元素融入自動化學(xué)習(xí)。