人工智能要挑戰(zhàn)四年級(jí)學(xué)生的智商了
導(dǎo)讀:人工智能是對(duì)人的意識(shí)、思維的信息過(guò)程的模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過(guò)人的智能。兔子的毛在哪個(gè)季節(jié)最厚實(shí)?一個(gè)叫做Aristo的電腦程序能告訴你答案,因?yàn)锳risto從四年級(jí)的書上學(xué)到熊在冬天會(huì)長(zhǎng)出更加厚實(shí)的皮毛,而且Aristo還從紐約州標(biāo)準(zhǔn)科學(xué)考試上學(xué)到了兔子也是哺乳動(dòng)物,由此Aristo能夠得到正確的答案。Aristo由西雅圖艾倫人工智能研究所研發(fā),是一款能夠感知人類社會(huì)常識(shí)的人工智能軟件。
而衡量它效果最好的方式,就是用適用于學(xué)齡兒童的測(cè)試來(lái)進(jìn)行檢測(cè)。該研究所還在說(shuō)服其他的AI研究人員,發(fā)展一種標(biāo)準(zhǔn),測(cè)試他們的成果。
這種標(biāo)準(zhǔn)的目的,是把AI和對(duì)自然語(yǔ)言研究的發(fā)展,用一種客觀的方式表現(xiàn)出來(lái),通過(guò)比較不同方法的優(yōu)缺點(diǎn),有助于我們更快找到最有效的方法從而加快AI的發(fā)展。
11月上旬,艾倫研究所將會(huì)發(fā)起一項(xiàng)挑戰(zhàn),讓研究人員研發(fā)出能做八年級(jí)(相當(dāng)于初二)理科試題的智能軟件。這個(gè)競(jìng)賽在科學(xué)競(jìng)賽網(wǎng)站Kaggle上正火熱進(jìn)行中,參賽人員可以通過(guò)千萬(wàn)道問(wèn)題來(lái)訓(xùn)練他們的軟件。如果一個(gè)軟件能夠解決出一道它從未見(jiàn)過(guò)的問(wèn)題,并得分最高的話,研發(fā)者將會(huì)獲得50,000 美元的獎(jiǎng)金。
現(xiàn)在Aristo距離做出四年級(jí)的理科測(cè)試,還有很大一段距離。它只能做多項(xiàng)選擇,而多項(xiàng)選擇占了測(cè)試的2/3。如果選擇題中不涉及圖形題的話,Aristo能做對(duì)75%,如果有圖形題的話就只能做對(duì)45%,而及格需要至少65分。Aristo在做不含有圖形題的八年級(jí)理科測(cè)試多項(xiàng)選擇時(shí),能得63分。你可以在艾倫研究所網(wǎng)站上,看到Aristo回答某些經(jīng)過(guò)選擇的問(wèn)題。這個(gè)軟件能夠應(yīng)用合理的計(jì)算法則,并通過(guò)網(wǎng)站上看到的學(xué)習(xí)指南,來(lái)回答這些問(wèn)題。
在AI 領(lǐng)域,想把哪怕一丁丁點(diǎn)常識(shí)塞進(jìn)軟件都是一個(gè)巨大挑戰(zhàn),但是一旦實(shí)現(xiàn),電腦就能進(jìn)一步以前所未有的方式幫助提高我們的生活。如果我們想研發(fā)出更加強(qiáng)大的系統(tǒng)來(lái)協(xié)助工作,那學(xué)習(xí)常識(shí)將是這些系統(tǒng)所必需的能力。其他的頂尖的研究人員也同意這一看法,這其中就包括Facebook的AI實(shí)驗(yàn)室,它正致力于使網(wǎng)絡(luò)虛擬助手具備一些基本的談話能力。目前市面上虛擬助手不具備常識(shí),比如蘋果的Siri 以及微軟的Cortana。他們只是根據(jù)你所說(shuō)的,從一個(gè)預(yù)編程的規(guī)則中選擇回復(fù)。
為機(jī)器學(xué)習(xí)常識(shí)的能力設(shè)定標(biāo)準(zhǔn)很有用,但也有人認(rèn)為,學(xué)校測(cè)試不是個(gè)好法子。
適用于孩子的測(cè)試可以確保研究人員不會(huì)有意,或無(wú)意地把這個(gè)領(lǐng)域的發(fā)展衡量標(biāo)尺變得太“easy”,但是孩子們?cè)谔剿魇澜绶矫婵杀葯C(jī)器軟件強(qiáng)太多了,為孩子們編寫的試題不能來(lái)做為衡量智能軟件的發(fā)展的標(biāo)尺。機(jī)器和人類所不擅長(zhǎng)的事物是非常不一樣的,適于人類的標(biāo)準(zhǔn)化測(cè)試,并不能很全面地覆蓋機(jī)器軟件所面臨的難點(diǎn)問(wèn)題。
更好的選擇是專門為機(jī)器軟件擬一份試題。比如這樣的測(cè)試題:Sally最心愛(ài)的奶牛昨天死掉了,奶??赡軙?huì)在多久之后復(fù)活?a) 明天; b) 一周以后;c) 一年以后; d)幾年后;e) 奶牛再也不會(huì)復(fù)活了。這種題對(duì)于四年級(jí)學(xué)生而言就是非常簡(jiǎn)單的。
不過(guò),盡管學(xué)校的測(cè)試題不會(huì)直接檢測(cè)常識(shí),但是卻間接地要求具備這些常識(shí)。因?yàn)樽x懂這些問(wèn)題就需要常識(shí),只有采用適用于人類的測(cè)試題,我們才能說(shuō)我們是以自己的標(biāo)準(zhǔn)在衡量機(jī)器軟件。
只有人類和機(jī)器位于同一起跑線,這一切才有意義。