對話Tom Mitchell:沒有計(jì)算機(jī)學(xué)位的他是如何成為機(jī)器學(xué)習(xí)教父的
按:在采訪Tom Mitchell前,編輯告訴他,目前媒體少有報(bào)道您的個人經(jīng)歷,這次的采訪我們希望能多聊一些您在不同的時間點(diǎn)何以做出當(dāng)時的抉擇。
當(dāng)Tom Mitchell看到編輯給的采訪提綱時,他立馬笑了,他說,“關(guān)于我為什么在本科和博士期間都拿的是電子工程的學(xué)位,這是一件有趣的事情”。
Tom Mitchell,他是全球公認(rèn)的機(jī)器學(xué)習(xí)教父,在全球人工智能實(shí)力排名第一的卡耐基梅隆大學(xué)(以下簡稱CMU)創(chuàng)辦了人類歷史上的第一個機(jī)器學(xué)習(xí)系并擔(dān)任系主任;他的經(jīng)典著作《機(jī)器學(xué)習(xí):一種人工智能方法》被認(rèn)為是行業(yè)圣經(jīng),銷量驚人;他創(chuàng)辦了美國《Machine Learning》雜志、國際機(jī)器學(xué)習(xí)年度會議(ICML),他的學(xué)術(shù)論文專著超過130篇;他擁有眾多閃亮的頭銜:CMU計(jì)算機(jī)科學(xué)學(xué)院機(jī)器學(xué)習(xí)系主任、教授,美國工程院院士,美國科學(xué)進(jìn)展學(xué)會(AAAS)成員,人工智能進(jìn)展學(xué)會(AAAI)成員。
這篇對話實(shí)錄,將呈現(xiàn)更多大家所不知道的Tom Mitchell:
他在CMU讀本科時,第一年主修數(shù)學(xué),第二年變成了管理學(xué),第三年是物理,第四年又成了電子工程,換了四次專業(yè),只因?yàn)椴恢老雽W(xué)什么;
他最終拿到了MIT電氣工程學(xué)位博士,但是卻去羅格斯大學(xué)當(dāng)計(jì)算機(jī)系助理教授和副教授,而后在CMU任計(jì)算機(jī)系教授,迄今為止都沒有計(jì)算機(jī)領(lǐng)域?qū)W位;
他在研究生期間開始對人類智力感興趣,在研究人類大腦和嘗試模擬人類大腦之間選擇了后者;
當(dāng)上世紀(jì)90年代,腦影像技術(shù)出現(xiàn)后,他開始進(jìn)行人工智能與人腦的交叉研究;
他認(rèn)為AI是一個整體,不應(yīng)該被細(xì)分為計(jì)算機(jī)視覺、語音識別、自然語言處理,應(yīng)該以整體的方式去學(xué)習(xí);
他目前正致力于Conversational Learning項(xiàng)目,讓機(jī)器從自然會話中學(xué)習(xí)如何編程;
在他看來,AI專業(yè)成為熱門一方面是大家的理性選擇,另一方面也有炒作過度,未來量子計(jì)算或?qū)⒈華I更火。
本科換四次專業(yè),不尋常的學(xué)生
“我進(jìn)入麻省理工讀本科時,第一年主修數(shù)學(xué),第二年變成了管理學(xué),第三年是物理,第四年又成了電子工程。我每一年都在換專業(yè),因?yàn)槲疫€沒想好要學(xué)什么?!?/p>
1951年,Mitchell出生于賓夕法尼亞的布洛斯堡,在紐約度過童年。1973年,他在麻省理工學(xué)院獲得電子工程學(xué)士學(xué)位,1979年獲得斯坦福大學(xué)電氣工程博士學(xué)位,輔修計(jì)算機(jī)科學(xué)。1978年,Mitchell在羅格斯大學(xué)開始教學(xué)生涯,擔(dān)任計(jì)算機(jī)系助理和副教授職位,1986年,Mitchell加入CMU成為一名計(jì)算機(jī)系教授。他的研究領(lǐng)域包括機(jī)器學(xué)習(xí)、人工智能、認(rèn)知神經(jīng)科學(xué)等領(lǐng)域。
:第一個問題,您的本科和博士專業(yè)是電子工程,當(dāng)時為什么要選擇這個專業(yè)?
Tom Mitchell:好吧,這是一件有趣的事情。事實(shí)上是因?yàn)?,我?dāng)時不知道自己應(yīng)該選什么專業(yè)。我進(jìn)入麻省理工讀本科時,第一年主修數(shù)學(xué),第二年變成了管理學(xué),第三年是物理,第四年又成了電子工程。我每一年都在換專業(yè),因?yàn)槲疫€沒想好要學(xué)什么。后來我去斯坦福讀研究生,主修晶體管設(shè)計(jì),成了一名電子工程師。但我又改變了主意,參加了計(jì)算機(jī)課程,就因?yàn)槲矣X得這個專業(yè)更好玩。后來我拿到了電子工程的博士學(xué)位。但這只是一個意外,因?yàn)殡m然我身在電子工程系,但我決定去學(xué)AI。我的確這么做了。不過,我目前拿到的仍然只有電子工程專業(yè)的學(xué)位。
:這是因?yàn)槁槭±砉ぴ试S你換專業(yè),對此其他老師沒有意見嗎?
Tom Mitchell:他們認(rèn)為這種現(xiàn)象很反常,但還是同意了我換專業(yè)的要求。最后,我修了電氣工程專業(yè)畢業(yè)所需的課程。
:您曾經(jīng)對頻繁更換專業(yè)感到厭煩嗎?
Tom Mitchell:不,我覺得很有趣。那時我真的不知道我想做什么,所以我嘗試了不同的領(lǐng)域。但事實(shí)是我對智力(intelligence)感興趣,我也想過學(xué)心理學(xué)。但我沒有去學(xué)心理學(xué),因?yàn)樵谖铱紤]這個問題的時候,心理學(xué)領(lǐng)域還沒有辦法研究人類的智慧。我不認(rèn)為心理學(xué)家或者是其他人能研究人類智力,因?yàn)楫?dāng)時還沒有“腦影像”(brain imaging)。
所以我就在想,他們甚至都沒有示波器這種衡量工具。我接受不了。這種研究方法不行。這太浪費(fèi)時間了,這種方法不可取。但之后,我又對人工智能產(chǎn)生了興趣,因?yàn)槿绻阆雽W(xué)習(xí)智力方面的東西,你有兩個選擇,你可以研究人類的大腦,也可以嘗試模擬人類的大腦。而當(dāng)時似乎沒有可以研究人類智力的設(shè)備,所以我決定走模擬人腦這條路。之后,腦成像終于在90年代末橫空出世,我就開始在那個時候研究起“腦影像”,就因?yàn)檫@種工具突然變成了現(xiàn)實(shí)。
:不過,Jordan和Hinton最開始對人工智能感興趣都是從心理學(xué)研究開始。
Tom Mitchell:他們比我更有勇氣,因?yàn)樗麄兪窃凇澳X影像”技術(shù)出現(xiàn)之前就在嘗試這種新事物。當(dāng)時我認(rèn)為這種研究不會有結(jié)果。所以我才選擇了創(chuàng)建智能程序這條路,但他們的確是勇氣可嘉。
:您從研究生開始學(xué)習(xí)機(jī)器學(xué)習(xí),當(dāng)時的契機(jī)是什么?這一學(xué)科在當(dāng)時還不是那么火。
Tom Mitchell:我始終認(rèn)為學(xué)習(xí)是智力中最有趣的部分,我現(xiàn)在還是這么想的。我想學(xué)習(xí)智力的同時也可以研究學(xué)習(xí),這就是我的選擇。這就是我的研究動機(jī)。我在讀研究生的時候就開始研究這個方向了。在我讀研究生,去學(xué)晶體管設(shè)計(jì)之后,我決定改學(xué)機(jī)器學(xué)習(xí),我的導(dǎo)師當(dāng)時有一個研究項(xiàng)目要創(chuàng)建一個幫助藥劑師設(shè)計(jì)藥品的AI系統(tǒng)。他們研究的問題之一就是分析化學(xué)實(shí)驗(yàn)中的數(shù)據(jù),也就是質(zhì)譜學(xué),其原理是你將一些化學(xué)品放進(jìn)機(jī)器中,讓它在與機(jī)器的碰撞中釋放能量,分裂成微粒。然后你再從中選擇場景以及你收集到的碎片?,F(xiàn)在的問題就是,這實(shí)際上是質(zhì)譜學(xué)的研究。所以我就最終通過后續(xù)的應(yīng)用完成了自己的論文。如果你將一個有機(jī)分子放入質(zhì)譜儀,就可以學(xué)到如何預(yù)測它的分裂之處,它的分裂方式。所以我們就掌握了一些有關(guān)化學(xué)的培訓(xùn)數(shù)據(jù),以及它們的獲取方式,此時的機(jī)器學(xué)習(xí)問題就是關(guān)于預(yù)測分子分裂方式的監(jiān)測學(xué)習(xí)問題。
:您談到90年代末開始研究腦影像,這個領(lǐng)域您有什么成果呢?
Tom Mitchell:我從事大腦研究工作十五年了,研究領(lǐng)域包括通過大腦成像、FMRI 和 MEG 技術(shù)研究語言在大腦中的表征,包括大腦如何表征不同詞語的含義,像是電腦、朋友或椅子這些詞。我們一直在做這方面的研究,并且已經(jīng)在表征不同含義的神經(jīng)活動模式領(lǐng)域獲得新發(fā)現(xiàn)。事實(shí)上,我們發(fā)現(xiàn)每個人的大腦在這方面擁有非常相似的模式。如果我提到番茄,每個人大腦的反應(yīng)模式其實(shí)是很相似的。在此之前,沒人發(fā)現(xiàn)這一點(diǎn)。我們發(fā)現(xiàn)了支持這些表征的系統(tǒng)原則,這樣一來我們就可以預(yù)測新詞。我們研發(fā)了一項(xiàng)電腦程序,對于你輸入的任何一個詞,它都能預(yù)測出這個詞的大腦模式。這些是我們的研究成果。
:你目前在做人工智能與人類大腦的交叉研究,請問人工智能采用的神經(jīng)網(wǎng)絡(luò)的工作原理與人腦思維方式的不同點(diǎn)是什么?
Tom Mitchell:我認(rèn)為人工神經(jīng)網(wǎng)絡(luò)和生物神經(jīng)網(wǎng)絡(luò)主要有兩點(diǎn)不同。第一,在人工神經(jīng)網(wǎng)絡(luò)里,我們通過數(shù)字傳遞數(shù)量。但在真實(shí)大腦中,神經(jīng)元以不同的速率進(jìn)行單個和成簇放電,這使得它與電腦神經(jīng)網(wǎng)絡(luò)十分不同。第二點(diǎn)不同是,在能夠識別圖像的卷積神經(jīng)網(wǎng)絡(luò)中,信息是從輸入層,即像素所在區(qū)域,有序地向外朝著最終答案流動的。但是如果你看一下大腦內(nèi)部以及大腦是如何理解圖像的,你會發(fā)現(xiàn)它對圖像的處理并不是前饋傳遞,在大腦中有信息從視覺皮層的兩個不同部分流出。但也有信息進(jìn)行反向流動。大腦中的反饋循環(huán)會告訴像素級別的神經(jīng)元,鑒于這兩側(cè)有線經(jīng)過,所以這里也應(yīng)該有一條線。因此,第二點(diǎn)不同是大腦中真正存在著反饋循環(huán),而在卷積神經(jīng)網(wǎng)絡(luò)中不存在。
:您從1978年開始在羅格斯大學(xué)擔(dān)任計(jì)算機(jī)系助理和副教授職位,當(dāng)時是如何從電子工程系轉(zhuǎn)到計(jì)算機(jī)系的?
Tom Mitchell:這并不是一個很關(guān)鍵的問題。雖然我畢業(yè)時拿的是電子工程學(xué)位,但我在攻讀博士學(xué)位期間已經(jīng)在進(jìn)修機(jī)器學(xué)習(xí)的課程了。所以,計(jì)算機(jī)科學(xué)系當(dāng)然會承認(rèn)我在這個學(xué)科上的教學(xué)能力。
當(dāng)時還沒有出現(xiàn)機(jī)器學(xué)習(xí)的學(xué)位。如果有的話,當(dāng)時我就會換成這個專業(yè),斯坦福大學(xué)應(yīng)該會把這方面的研究納入計(jì)算機(jī)系而不是電子工程專業(yè)??上覜]換專業(yè)。
:您此前多次更換專業(yè),那么您攻讀博士學(xué)位時為什么沒有根據(jù)自己的想法換專業(yè)呢?
Tom Mitchell:你是說我為什么不讀計(jì)算機(jī)科學(xué)博士學(xué)位是嗎?原因?qū)嶋H上很簡單,你在斯坦福大學(xué)讀博士學(xué)位時,到了第二年就會面臨一些很嚴(yán)格的考試。你只有通過了這些考試,才能順利拿到學(xué)位。我當(dāng)時參加并通過了電子工程專業(yè)的考試。后來我說我實(shí)際上想去計(jì)算機(jī)科學(xué)系,我想調(diào)劑專業(yè)。計(jì)算機(jī)科學(xué)系方面表示,你不能調(diào)劑,你得先提出申請,我們有可能接收你,之后你得參加我們的博士資格考試才算過關(guān)。然后我就說,好吧,我還是繼續(xù)呆在電子工程系好了。但我的博士導(dǎo)師是Bruce教授,他是計(jì)算機(jī)科學(xué)方面的專家。所以我雖然是電子工程專業(yè)的學(xué)生,但我也是計(jì)算機(jī)科學(xué)導(dǎo)師的弟子。
:那么您當(dāng)時有多少導(dǎo)師呢?
Tom Mitchell:兩個,主要導(dǎo)師就是計(jì)算機(jī)科學(xué)系的Bruce教授。但因?yàn)槲沂请娮庸こ虒I(yè)的學(xué)生,所以我也有一個電子工程導(dǎo)師Bernie教授,他也是AI領(lǐng)域方面的先驅(qū)之一,因?yàn)樗鲞^大量有關(guān)感知機(jī)的早期研究工作。
:您在本科和博士期間的學(xué)習(xí)經(jīng)歷在中國和中國的教育體制中幾乎無法復(fù)制。
Tom Mitchell:雖然我不知道這種情況。但在卡內(nèi)基梅隆大學(xué)和許多美國大學(xué)里,學(xué)生可以換專業(yè),有時候?qū)W生也會換導(dǎo)師,比如五個博士學(xué)生中就會有一人在某個階段跟一位導(dǎo)師,后來又換成其他導(dǎo)師,這種現(xiàn)象并不算罕見。
:您指導(dǎo)過中國學(xué)生嗎?
Tom Mitchell:我的學(xué)生來自五湖四海,當(dāng)然也有中國學(xué)生,目前我?guī)ьI(lǐng)的中國學(xué)生是Fan Yang。我現(xiàn)在的學(xué)生不但有中國人,還有希臘人、羅馬尼亞人、美國人、加拿大人、斯洛文尼亞人,總之天南地北的學(xué)生都有。我很樂見這種現(xiàn)象,因?yàn)槲艺J(rèn)為一個富有創(chuàng)意的團(tuán)隊(duì)就應(yīng)該有不同的思想碰撞,集合不同的教育背景,畢竟不同國家的學(xué)生接受的教育也各不相同。將各種學(xué)生組合在一起,就形成了一個團(tuán)隊(duì)。我們可以通過相互學(xué)習(xí),互補(bǔ)長短。
:所以您認(rèn)為中國學(xué)生有哪些不同于其他國家學(xué)生的特點(diǎn)嗎?
Tom Mitchell:可以這么說。這是個很廣泛的問題。我認(rèn)識許多中國學(xué)生,所以我知道中國學(xué)生的類型并不單一。中國學(xué)生也有各種各樣的類型。但總體而言,我發(fā)現(xiàn)中國學(xué)生在進(jìn)入卡內(nèi)基梅隆大學(xué)之前學(xué)習(xí)就非常用功,我也經(jīng)常在研究生院碰到他們。他們學(xué)習(xí)很努力,他們也清楚自己的基礎(chǔ)很扎實(shí)。我認(rèn)為這是中國學(xué)生的特質(zhì)之一。
:我很想知道,您挑選學(xué)生的標(biāo)準(zhǔn)有哪些呢?
Tom Mitchell:我其實(shí)不便公開透露這一點(diǎn),否則可能就會有人刻意迎合我的要求。實(shí)際上,不同教授的行事方式各不相同。我最看重的天賦是創(chuàng)造力。有些教授會挑成績最好的學(xué)生,或者發(fā)表論文數(shù)量最多的學(xué)生。但我不會這么做,我只會和對方走進(jìn)教室,聊一些我們彼此可能都不太清楚的話題。看看我們究竟能聊多久。如果我們交流很順利,我覺得我們就可以共事。
ICML:從講習(xí)班到5000人大會
“可我們那時候從來沒有想到,機(jī)器學(xué)習(xí)會獲得商業(yè)上的成就。我們只是單純地覺得它是一個很有趣的智能問題?!?/p>
在加入CMU之前,Tom Mitchell就已經(jīng)頻繁來往于CMU組織ICML(國際機(jī)器學(xué)習(xí)大會),1980年,ICML第一次在CMU召開,從最初的幾十人發(fā)展到目前數(shù)千人參加的國際大會,ICML與NIPS一起,它是在機(jī)器學(xué)習(xí)和人工智能研究中影響最大的兩個主要會議之一。
:您是ICML創(chuàng)始人,并在1980年舉辦了首屆ICML學(xué)術(shù)會議,當(dāng)時有哪些科學(xué)家同您一起推廣了這個會議?
Tom Mitchell:那次會議是在卡內(nèi)基梅隆大學(xué)舉辦的,當(dāng)時也是我初次來到這所大學(xué),因?yàn)槟菚r候我還在羅杰斯大學(xué)教書。為了召開那次會議,我就去了卡內(nèi)基梅隆大學(xué)。當(dāng)時還有另外兩名重要成員聯(lián)合組織了這場會議,我們一共是三人。一位是Jaime Carbonell,他現(xiàn)在仍然是卡內(nèi)基梅隆大學(xué)的教授。他當(dāng)時已經(jīng)在這所大學(xué)任教了,所以我們才會在這里舉辦會議。另一位就是伊利諾伊大學(xué)教授Richard。我們?nèi)齻€人就在1980年聯(lián)合舉辦了這場會議。我記得當(dāng)時的會場只比今天這個房間大一點(diǎn)點(diǎn),一共有35人出席了會議。我現(xiàn)在還記得一些當(dāng)時的出席人員。當(dāng)最讓我印象深刻的人應(yīng)該是John Anderson,因?yàn)镴ohn是一位研究人類學(xué)習(xí)模式,并據(jù)此創(chuàng)建計(jì)算機(jī)模型的心理學(xué)家。
我之前也提到了,我對人類智力很感興趣,但放棄了研究心理學(xué),就是因?yàn)檫@一行沒有什么輔助研究的儀器。John Anderson在那次會議上的確讓我記憶猶新,因?yàn)樗且幻芯繉W(xué)習(xí)與人類的心理學(xué)家。而且他取得了卓越的研究成果。他當(dāng)時在創(chuàng)建可以展示電腦行為如何匹配人類行為的計(jì)算機(jī)模型。John今天仍然在這所大學(xué)的心理系任教。去年,我們還做出一項(xiàng)決定,讓他的團(tuán)隊(duì)與我的團(tuán)隊(duì)每個月碰面一次,相互交流思想。我很珍惜與他共事的機(jī)會,真的非常有收獲。
:您當(dāng)時成立并推廣ICML的契機(jī)是什么?
Tom Mitchell:這么說吧。ICML其實(shí)是自發(fā)形成的。我們在卡內(nèi)基梅隆大學(xué)舉辦了首次會議,可能在兩年后我們就決定把它作為一個關(guān)于機(jī)器學(xué)習(xí)的講習(xí)班。當(dāng)時我們沒有將它稱為國際會議。兩年之后的伊利諾伊大學(xué)召開了第二場會議,當(dāng)時還是我們?nèi)藫?dān)任組織者。后來我們開始每年召開一次,每年會議都出現(xiàn)了不少驚喜,會議規(guī)模也不斷擴(kuò)大。又過了幾年,我們才決定將它稱為國際大會。現(xiàn)在還保留著每年召開會議的傳統(tǒng)?,F(xiàn)在每年都有上千人參加這個會議。
:發(fā)展到現(xiàn)在,ICML2018的參會人數(shù)已經(jīng)超過5000人,這與您最初的設(shè)想是否一致?當(dāng)時有想到這一會議會像如今這般火熱嗎?
Tom Mitchell:沒有,完全沒想到。我相信這個會議的參加者都想不到有這么一天。但我始終認(rèn)為,機(jī)器學(xué)習(xí)在未來會成為計(jì)算機(jī)科學(xué)的中心,想想計(jì)算機(jī)科學(xué)的發(fā)展就很容易得出這個結(jié)論??傆幸惶?,我們不再需要手動編程,我們可以讓程序自己學(xué)習(xí)編程。我一直在設(shè)想它早期的運(yùn)行方式,我始終認(rèn)為這終將變成一種重要的應(yīng)用。但我時常在想,我有生之年可能看不到這一天了。計(jì)算機(jī)科學(xué)可能需要經(jīng)歷幾百年才能發(fā)展到這個地步。希望它能夠以超乎我想象的速度,實(shí)現(xiàn)飛速發(fā)展。但在過去,我認(rèn)為參加我們會議的人都認(rèn)為,這種技術(shù)是一種學(xué)術(shù)人士才關(guān)注的最有趣的智能話題之一。
可我們那時候從來沒有想到,機(jī)器學(xué)習(xí)會獲得商業(yè)上的成就。我們只是單純地覺得它是一個很有趣的智能問題。
扛起CMU人工智能教育大旗
“我認(rèn)為未來本科階段的機(jī)器學(xué)習(xí),并不僅僅是針對AI專業(yè)的學(xué)生,而是一種許多技術(shù)領(lǐng)域的學(xué)生都應(yīng)該掌握的默認(rèn)數(shù)學(xué)知識?!?/p>
1986年加入CMU之后,Tom Mitchell一頭扎入了機(jī)器學(xué)習(xí)的學(xué)術(shù)研究和教育教學(xué)之中。1997年,Mitchell出版機(jī)器學(xué)習(xí)領(lǐng)域的第一本教科書,名為《機(jī)器學(xué)習(xí)》,是機(jī)器學(xué)習(xí)領(lǐng)域的奠基之作,被奉為第一代機(jī)器學(xué)習(xí)的圣經(jīng),是入門機(jī)器學(xué)習(xí)的必讀教材之一。2006年,他在CMU計(jì)算機(jī)科學(xué)學(xué)院創(chuàng)辦機(jī)器學(xué)習(xí)系,并成為第一任系主席。2010年,他因在機(jī)器學(xué)習(xí)領(lǐng)域杰出地位入選美國國家工程院院士。
今年秋天,CMU 成為美國首個提供人工智能本科學(xué)位的大學(xué)。從本科教育啟航培養(yǎng)AI人才,CMU的AI研究和AI教育都走在世界的先列。
:Michael Jordan在伯克利進(jìn)行AI教學(xué)有一系列課程,包括「data 8」和connector 課程,CMU今年秋季也開始了AI 的本科課程,有哪些特色課程?現(xiàn)在報(bào)名情況如何?
Tom Mitchell:對于本科專業(yè),這學(xué)期我們剛剛迎來了新一屆的學(xué)生。在本科生階段,我們每年總共有200名本科生進(jìn)入計(jì)算機(jī)科學(xué)系。他們讀完第一學(xué)年之后可以選擇主修AI專業(yè)或者傳統(tǒng)的計(jì)算機(jī)科學(xué)專業(yè),我們的目標(biāo)是第一年招收10%的AI學(xué)生。所以我們的目標(biāo)是招收20名學(xué)生。這也大概就是我們可能會招到的學(xué)生數(shù)量。我們現(xiàn)在正在教授其它課程。
這還只是第一學(xué)年,我認(rèn)為我們的課程值得稱道的一點(diǎn)就是,我們會教授機(jī)器學(xué)習(xí)方面的內(nèi)容。這本來是大二時才會傳授的課程。而且我認(rèn)為這是很正確的事情,因?yàn)槲艺J(rèn)為未來本科階段的機(jī)器學(xué)習(xí),并不僅僅是針對AI專業(yè)的學(xué)生,而是一種許多技術(shù)領(lǐng)域的學(xué)生都應(yīng)該掌握的默認(rèn)數(shù)學(xué)知識。我在讀工程學(xué)本科專業(yè)時,也學(xué)了微積分學(xué),因?yàn)槲艺J(rèn)為這個學(xué)科很重要,我很高興自己做了這個選擇。它是工程學(xué)的數(shù)學(xué)。
微積分仍然是一門很有價值的課程。但我認(rèn)為統(tǒng)計(jì)學(xué)可能會成為更有價值的學(xué)科。即便如此,對今天的多數(shù)本科生來說,微積分都是一門重要的學(xué)科,因?yàn)榻?jīng)驗(yàn)數(shù)據(jù)分析會成為未來各個職業(yè)的重要部分,而這種分析就離不開微積分。不過也不盡然,除非你是工程學(xué)專業(yè)的學(xué)生。
:那么設(shè)定10%的招生率,就是為了控制學(xué)生的規(guī)模是嗎?
Tom Mitchell:我們想先從少數(shù)學(xué)生入手,可能只有兩名學(xué)生,因?yàn)橄裱芯可昙壍臋C(jī)器學(xué)習(xí)一樣的新本科課程真的是太多了。所以我們希望先在周末時進(jìn)行小班授課,我們在發(fā)展這個課程期間最好保持良好的教師與學(xué)生比例。之后,我想我們的招生比例就會顯著超過10%。
:如何挑選這10%的學(xué)生呢?
Tom Mitchell:這個也是我們目前討論的問題,我們卡內(nèi)基梅隆大學(xué)推出了很嚴(yán)格的入學(xué)要求。但只要學(xué)生能夠考入計(jì)算機(jī)科學(xué)的本科專業(yè),我們就允許他們選擇AI或者計(jì)算機(jī)科學(xué)作為自己的專業(yè),我們認(rèn)為如果招生超過20%,我們就得啟動篩選流程,但目前學(xué)生人數(shù)還沒超過這個比例,所以運(yùn)行情況良好。我們也不需要對其進(jìn)行管理,目前教學(xué)秩序正常。
AI不應(yīng)該被劃分成不同技術(shù)
“我沒有想過,也不認(rèn)為AI可以劃分成許多不同的板塊。我不可能推薦學(xué)生去專修哪個領(lǐng)域的內(nèi)容。如果非要推薦的話,我會建議他們涉獵所有相關(guān)知識,吃透這些內(nèi)容后再將其結(jié)合在一起。”
:卡內(nèi)基梅隆大學(xué)的教授和學(xué)生最關(guān)注哪種AI技術(shù)?
Tom Mitchell:我沒有想過,也不認(rèn)為AI可以劃分成許多不同的板塊。我和自己的學(xué)生交流時,我會盡量不去建議他們專修哪種技術(shù)、深層網(wǎng)絡(luò)、自然語言理解或者類似的東西。因?yàn)槲艺J(rèn)為未來的AI,甚至是當(dāng)前的AI(但未來趨勢會更明顯),會以我們還沒有開發(fā)的做法來整合、結(jié)合我們不同的方法。所以我不可能推薦學(xué)生去專修哪個領(lǐng)域的內(nèi)容。如果非要推薦的話,我會建議他們涉獵所有相關(guān)知識,吃透這些內(nèi)容后再將其結(jié)合在一起。
:您能舉例說明如何將各項(xiàng)AI技術(shù)整合嗎?
Tom Mitchell:例如,我做了很多有關(guān)機(jī)器學(xué)習(xí)的研究,但我想將機(jī)器學(xué)習(xí)應(yīng)運(yùn)用于不同的領(lǐng)域,針對不同的方向推進(jìn)這種應(yīng)用。在機(jī)器學(xué)習(xí)領(lǐng)域,可以說有許多人習(xí)慣于認(rèn)為你可以用貝葉斯或者深層網(wǎng)絡(luò)來做研究??傊?,你擇其一而行。但今天,我們越來越清楚如何使用深層網(wǎng)絡(luò)來 了解概率分布的問題。所以,認(rèn)為這種研究是一個非此即彼的選擇,這種想法是錯誤的。如果你同時掌握了兩個領(lǐng)域的知識,你只要將它們結(jié)合在一起,讓深層網(wǎng)絡(luò)去掌握概念分布的知識就可以了。針對我不想建議別人去學(xué)某項(xiàng)技術(shù)的問題,我能舉的實(shí)例就是:我想讓他們關(guān)注知識整合,將不同的方法融為一體,集百家之大成。
:CV和語音技術(shù)發(fā)展已經(jīng)趨近成熟,NLP還要多久才能達(dá)到同樣的程度?NLP的機(jī)會在哪里?
Tom Mitchell:這個問題有兩個答案。第一個是,我不認(rèn)為它們正不斷趨于成熟。我認(rèn)為語音識別和計(jì)算機(jī)視覺仍然將持續(xù)取得重大進(jìn)步。但我認(rèn)為它們只能說是不斷接近人類的水平,而不能算是趨于成熟。
:但是CV和語音識別的準(zhǔn)確率已經(jīng)接近100%了。
Tom Mitchell:那是因?yàn)槲覀兪褂萌祟惖臉?biāo)準(zhǔn)來衡量這種技術(shù)的發(fā)展。但計(jì)算機(jī)視覺將繼續(xù)超越人類。比如,有一些高分辨率的攝像頭已經(jīng)能夠觀察到角落里的塑料袋,發(fā)現(xiàn)塑料袋在振動,可以用計(jì)算機(jī)視覺觀察震動當(dāng)時,并據(jù)此判斷人的說話的內(nèi)容。我認(rèn)為計(jì)算機(jī)視覺不會止步于人類的水平,它會超越人類視覺,我們將把它作為一種感應(yīng)設(shè)備來獲取人類無法感知的信息。
我認(rèn)為聲音識別也可以超越人類水平,甚至越過語音識別技術(shù)的發(fā)展。我認(rèn)為人們說話的時候,他們說話的聲音(而不是內(nèi)容)輪廓含有大量有關(guān)其心理狀態(tài)的信息,比如他們是否心情愉快?他們是在說話嗎?他們說的是真話嗎?他們現(xiàn)在很不安嗎?我認(rèn)為超人類的語音識別技術(shù)將能夠破解語言中含有的更多信息,就好像超人類視覺可以破解更多圖像信息一樣。所以我認(rèn)為它們的發(fā)展不會止步于人類的水平。
請?jiān)试S我用NLU而不是NLP(自然語言理解)這個術(shù)語。我們不談自然語言處理,因?yàn)樗婕霸S多概念,而是把它稱為自然語言理解,它是一個非常有難度的問題。從某種意義上說,這可能完全是一個人工智能的問題,如果你能夠真正解決自然語言理解的問題,那么你還必須解決AI領(lǐng)域中大多數(shù)關(guān)于推理和表現(xiàn)的其它大型開放性問題。所以我認(rèn)為自然語言理解是AI領(lǐng)域中最困難的開放性問題之一。我認(rèn)為我們在未來十年會在這方面獲得許多進(jìn)步。我們很難預(yù)測我們究竟能否解決這個問題,以及何時解決這個問題。
讓機(jī)器在對話中學(xué)習(xí)——Conversational Learning
Mitchell在計(jì)算機(jī)科學(xué)領(lǐng)域出版了130余篇文章,內(nèi)容涵蓋機(jī)器學(xué)習(xí)、人工智能、認(rèn)知神經(jīng)科學(xué)等領(lǐng)域,在機(jī)器學(xué)習(xí)方面,他主要研究統(tǒng)計(jì)學(xué)習(xí)算法的開發(fā)和應(yīng)用,如賦予計(jì)算機(jī)理解自然語言的能力以及發(fā)現(xiàn)人腦如何表示信息。
Mitchell 與其在 CMU 心理學(xué)系的同仁創(chuàng)建了首個預(yù)測大腦神經(jīng)元激活模式的計(jì)算模型,該研究后來被擴(kuò)展到其它單詞類型、單詞序列和情緒中。
他開發(fā)出名為NELL(Never-Ending Language Learning)的計(jì)算機(jī)程序,能夠從 web 中不斷抽取信息,并教會自己閱讀。
在11月15日的“全球AI+智適應(yīng)教育峰會”上,Tom Mitchell介紹了一項(xiàng)他們正在研究的技術(shù)——Conversational Learning(會話學(xué)習(xí)),希望能通過對話的形式教會手機(jī)理解用戶的指令,自己編程來完成命令,同時不斷從這個過程中學(xué)習(xí)進(jìn)化,最終實(shí)現(xiàn)機(jī)器人可以自己編程的目標(biāo)。
:您在今天的大會上談到了一種可指導(dǎo)機(jī)器學(xué)習(xí)——Conversational Learning(會話學(xué)習(xí)),你能再解釋一下嗎?
Tom Mitchell:它的理念就是今天多數(shù)機(jī)器學(xué)習(xí)算法都在執(zhí)行大數(shù)量的統(tǒng)計(jì)性分析。但這只是人們通過尋找結(jié)果、統(tǒng)計(jì)趨勢而掌握的學(xué)習(xí)方法之一。人們還有其它學(xué)習(xí)方法。人們可以通過對話交流、閱讀書籍、進(jìn)行實(shí)驗(yàn)來學(xué)習(xí)。所以我們的會話學(xué)習(xí)項(xiàng)目的理念就是,我認(rèn)為未來會出現(xiàn)超越統(tǒng)計(jì)式學(xué)習(xí)的機(jī)器學(xué)習(xí)方式。這對我來說是一個很自然的發(fā)展過程。所以,我們開展了這方面的研究,例如,我們有一個目標(biāo)是讓每個擁有手機(jī)的人教手機(jī)如何執(zhí)行新任務(wù)。那么這會出現(xiàn)什么新應(yīng)用呢?比如,我想告訴自己的手機(jī),無論何時有人給我發(fā)送了一張我媽媽的照片,那就請把照片轉(zhuǎn)發(fā)給我媽媽。我的手機(jī)實(shí)際上可以做到這一點(diǎn),但它還沒有這么做,那是因?yàn)檫€沒有人編寫這樣的程序。但如果我可以同自己的手機(jī)進(jìn)行對話,相信手機(jī)就可以掌握這種技能。如果這種技術(shù)成熟了,我就可以教手機(jī)如何做到這一點(diǎn)。我可以給手機(jī)展示一下我媽媽的一些照片,讓它可以學(xué)習(xí)一下人臉識別的技術(shù)。然后我再對手機(jī)說,把照片發(fā)送給我媽,這樣,我就可以教它怎么執(zhí)行這個操作。這就像編程一樣,但它并不是使用java或python這種語言來編程。我是在使用自然語言來編程。
:您是否有關(guān)于Conversational Learning的論文?
Tom Mitchell:我們的確寫了幾篇關(guān)于這項(xiàng)研究的論文。最早的一篇論文是2016年時發(fā)布于IEEE的論文,我們在該論文中介紹了這個系統(tǒng)的第一個版本。從那時候開始,我們發(fā)表了許多論文,其中涉及我今天無暇在會議上分享的最有趣的開發(fā)項(xiàng)目。但我認(rèn)為那個項(xiàng)目最有趣的新方向就是,我們發(fā)現(xiàn)人們在傳授知識時,有許多內(nèi)容你只想通過對話來表達(dá)。有時候向人傳授知識會更容易一些。假設(shè)我想說,無論下午外面何時下雨了,請?jiān)谖译x開辦公室前提醒我?guī)嫌陚?。好吧,這是我想教手機(jī)掌握的另一項(xiàng)技能。但現(xiàn)在我得教手機(jī)學(xué)習(xí)了,我該如何教手機(jī)反饋外面是否下雨的情況?這個時候,親自示范可能要比說話更容易一點(diǎn)。我可能會說,如果你想知道外面是否下雨,打開天氣預(yù)報(bào)app,看一下當(dāng)時的天氣狀況就行了。如果天氣預(yù)報(bào)顯示有雨,那就是下雨了,你這么說就可以了。但親自示范就是要比說話更容易理解。所以我們在這個系統(tǒng)的最新版本中,整合了通過展示和口頭對話來傳授本領(lǐng)的功能,以便人們可以結(jié)合這兩種方法向手機(jī)傳達(dá)指令。
:我們會推動這種技術(shù)實(shí)現(xiàn)商業(yè)化嗎?
Tom Mitchell:有人會,但在此之前還是得先解決一些技術(shù)性問題。我們有一個原型可以展示這種強(qiáng)大的功能,但這個原型也失敗了。我們針對這個機(jī)械進(jìn)行了測試,我們?yōu)榇斯陀昧?23個人在非語音模式下使用我們的系統(tǒng),他們只能通過打字這種仍然屬于自然語言的模式,教系統(tǒng)執(zhí)行大約20項(xiàng)任務(wù)。測試結(jié)果發(fā)現(xiàn),完成了了測試的人員都取得了良好的結(jié)果,但在這123人中僅有半數(shù)人完成了測試,其他人都失敗了,因?yàn)橛?jì)算機(jī)并不能完全理解他們發(fā)出的指令。所以我認(rèn)為,這項(xiàng)技術(shù)的商業(yè)化之路任重道遠(yuǎn)。但我仍然認(rèn)為它是當(dāng)前十分重要的一個研究領(lǐng)域。
理性擁抱AI
:機(jī)器學(xué)習(xí)很火熱,現(xiàn)在很多人都一窩蜂涌上來要學(xué)習(xí)機(jī)器學(xué)習(xí),你如何看待這種現(xiàn)象?
Tom Mitchell:我想,出現(xiàn)這個現(xiàn)象有兩個原因。其中一個原因,我認(rèn)為是理性的。如果你看下自己可以主修的所有學(xué)科,選擇機(jī)器學(xué)習(xí)或者AI不失為一個理性的選擇,因?yàn)檫@是一個迅速發(fā)展的領(lǐng)域,如果你掌握了這項(xiàng)技能和知識,未來就有可能參與許多有趣的事情,從這個角度來看這是一種理性的選擇。但這其中也有過度炒作的成分。我認(rèn)為再過幾年這一行的炒作就會消失,人們終會回歸理性。
:現(xiàn)在什么都往AI上靠,甚至包括波士頓動力機(jī)器人也有人說它用了AI算法,如何讓大家理性看待AI?
Tom Mitchell:我認(rèn)為AI仍然是一個非正式術(shù)語。目前來看,它只是一個流行使用的非正式術(shù)語。所以每家公司都希望在宣傳上蹭一下AI的熱度。這倒沒錯,我是說我認(rèn)為多數(shù)消費(fèi)者都很清楚,市場營銷部門都很擅長使用這種噱頭,聲稱自己使用了AI技術(shù),實(shí)際上未必如此。這些公司實(shí)際上可能只是使用了非常簡單,或者非常復(fù)雜的算法。這種現(xiàn)象可能過一段時間就會發(fā)生變化,因?yàn)锳I概念現(xiàn)在很火,大家就喜歡用這種套路,但今后可能又會出現(xiàn)更熱門的概念。到時候,大家又會說他們家的產(chǎn)品使用了這種新技術(shù)。這種現(xiàn)象并不奇怪。
:您認(rèn)為未來還有什么技術(shù)會比AI更流行?
Tom Mitchell:很難說,我只能說區(qū)塊鏈現(xiàn)在在中國很火,但從長遠(yuǎn)來看,我并不認(rèn)為它會比AI走得更遠(yuǎn)。量子計(jì)算( Quantity computing)如果被證實(shí)可行的話,有可能比AI更熱門,但這還得再等上幾年才看得分明。
總結(jié)
雖然Tom Mitchell教授每年都把其最新的思想和研究帶來中國,但是我們很少有機(jī)會能與他進(jìn)行一對一的探討,在這次長達(dá)一個小時的一對一專訪中,Tom Mitchell教授解決了編輯諸多疑問,在AI大牛的光環(huán)之下,我們也了解到了一個更加真實(shí)、更完整的Tom Mitchell。
整個采訪過程中,Tom Mitchell教授說話慢條斯理,總是面帶微笑,聲音中充滿愉悅的氣息。能與他對談,讓人覺得是一件幸運(yùn)的事。
相關(guān)文章:
機(jī)器學(xué)習(xí)教父 Tom Mitchell :人工智能將成為自適應(yīng)學(xué)習(xí)的驅(qū)動式技術(shù) | 全球AI+智適應(yīng)教育峰會
肩扛CMU人工智能大旗,機(jī)器學(xué)習(xí)教父Tom Mitchell如何講述AI+教育?
專訪機(jī)器學(xué)習(xí)祖師爺 Tom Mitchell:帶著理性擁抱機(jī)器學(xué)習(xí)的熱潮 | GMIC 2018
對話機(jī)器學(xué)習(xí)教父Tom Mitchell:人工智能不會出現(xiàn)第三次衰退了 | GMIC 2017
《機(jī)器學(xué)習(xí)》作者Tom Mitchell:人工智能如何向人類大腦學(xué)習(xí) | GMIC 2017
吳甘沙對話Tom Mitchell:人工智能如何顛覆我們的城市 | GMIC 2017
原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。