腦細(xì)胞研究員感謝人工智能
腦細(xì)胞研究員的獨白:感謝人工智能,不用再每天對著顯微鏡苦干了
2007年,在進(jìn)入大三之前的那個夏天,我一直在做一件事:從小鼠身上取下小塊腦組織,放到培養(yǎng)皿中進(jìn)行培養(yǎng),仔細(xì)觀察其中的神經(jīng)元。在三個月時間里,我每周有5、6天,每天有3、4個小時都待在一個小房間里,盯著一臺顯微鏡看,給腦細(xì)胞拍照。房間漆黑一片,只有神經(jīng)元發(fā)出的瑩瑩綠光。
當(dāng)時,我正在研究一種特定的生長因子能否保護(hù)神經(jīng)元免受神經(jīng)退行性疾病的影響,比如帕金森玻這種在神經(jīng)學(xué)研究中很常見的工作需要耗費大量時間,以及對細(xì)節(jié)幾近病態(tài)的關(guān)注。這就是為什么課題組負(fù)責(zé)人要培訓(xùn)我這樣一個低級別的本科生來做這件事,正如幾十年前,某個人來培訓(xùn)他做這件事一樣。
現(xiàn)在,研究人員認(rèn)為,他們可以訓(xùn)練機器接管這些瑣碎的工作。
在刊于《細(xì)胞》雜志的一項研究中,由格拉德斯通研究所(Gladstone Institutes)和加州大學(xué)舊金山分校神經(jīng)科學(xué)家史蒂芬芬克拜納(Steven Finkbeiner)領(lǐng)導(dǎo)的團(tuán)隊與谷歌的研究人員進(jìn)行了合作,他們訓(xùn)練出一種機器學(xué)習(xí)算法,可以對培養(yǎng)皿中的神經(jīng)元細(xì)胞進(jìn)行分析。
研究人員使用了一種名為深度學(xué)習(xí)的方法,這種機器學(xué)習(xí)技術(shù)不僅推動谷歌取得了一系列成果,在亞馬遜、Facebook、微軟等一系列人們耳熟能詳?shù)目萍脊局?,也得到了重用。深度學(xué)習(xí)依靠的是模式識別:向系統(tǒng)饋入足夠多的訓(xùn)練數(shù)據(jù)可能是動物圖像,可能是專業(yè)圍棋棋手的招式,也可能是人工培養(yǎng)腦細(xì)胞的照片然后,它就可以去辨識貓,去挑戰(zhàn)世界頂級棋手,或是弄清神經(jīng)元的形態(tài)特征。
用這種方式訓(xùn)練人工智能系統(tǒng),最難的兩件事在于:
1)生成規(guī)模足夠大的數(shù)據(jù)集;
2)找人對數(shù)據(jù)集進(jìn)行標(biāo)記。
幸運的是,大多數(shù)神經(jīng)科學(xué)實驗室都擁有足夠多的細(xì)胞培養(yǎng)物可供轉(zhuǎn)化為訓(xùn)練數(shù)據(jù)(芬克拜納的實驗室已經(jīng)讓顯微鏡檢查過程的多個環(huán)節(jié)實現(xiàn)了自動化,它生成的圖像數(shù)量已經(jīng)超出了實驗室的分析能力),而且也有足夠多的人手對數(shù)據(jù)進(jìn)行標(biāo)記。
“基本上,這有賴于大量的暑期學(xué)生、研究生和博士后,讓他們來做人工標(biāo)記,將數(shù)據(jù)饋入計算機?!狈肿由窠?jīng)科學(xué)家瑪格麗特薩瑟蘭德(Margaret Sutherland)說。她是全美神經(jīng)病學(xué)與中風(fēng)研究所的項目主任,該機構(gòu)資助了上述研究。(即便有了人工智能,學(xué)生和博士后似乎還是免不了要干這些累活。)
芬克拜納的團(tuán)隊開發(fā)了一個深度神經(jīng)網(wǎng)絡(luò),并使用細(xì)胞圖像對它進(jìn)行了訓(xùn)練,這些圖像有的帶有熒光標(biāo)記,有的則沒有。這些發(fā)光的標(biāo)記有助于區(qū)分不同的細(xì)胞類型,還可以讓研究人員更容易判斷神經(jīng)元的末端位置以及軸突和樹突的起始點。(軸突和樹突是神經(jīng)元中突出的部分,負(fù)責(zé)跟其他神經(jīng)元交換電化學(xué)信號。)不過,很多標(biāo)記方法也會損害你試圖觀察的細(xì)胞。
然而,通過訓(xùn)練,研究人員的算法能夠識別出它之前從未見過的特定類型的腦細(xì)胞。此外,算法還可以辨別死細(xì)胞和活細(xì)胞,定位細(xì)胞核,區(qū)分軸突和樹突,而且這一切都不需要熒光標(biāo)記的幫助。芬克拜納團(tuán)隊把他們的機器學(xué)習(xí)方法稱為ISL。
由于分析細(xì)胞并不需要添加固定劑或熒光染料,因此與傳統(tǒng)方法相比,ISL的優(yōu)點包括:前后標(biāo)記更一致,對培養(yǎng)物的損害更小,而且能夠?qū)?xì)胞的健康狀況實現(xiàn)更長期的監(jiān)測。
此外,由于只有訓(xùn)練算法時才需要用到人手,這種方法還可以為研究人員提供一種分析大量數(shù)據(jù)的途徑,他們不再需要招募大量實驗室技術(shù)人員在黑暗中對著顯微鏡埋頭苦干。
對生物醫(yī)學(xué)領(lǐng)域的研究人員來說不管他們是在大型研究院校資金充裕的實驗室工作,還是為一家小型初創(chuàng)公司效力這都是個好消息。“像這樣的技術(shù)往往會產(chǎn)生民主化效應(yīng)?!庇嬎銠C生物學(xué)家、艾倫細(xì)胞科學(xué)研究所(Allen InsTItute for Cell Science)的數(shù)學(xué)建模主管莫莉馬拉卡(Molly Maleckar)說。馬拉卡沒有參與芬克拜納的研究。
她和同事們曾利用類似的無標(biāo)記機器學(xué)習(xí)技術(shù)來識別亞細(xì)胞結(jié)構(gòu)。她說,通過結(jié)合機器學(xué)習(xí)方法,規(guī)模較小的生物醫(yī)學(xué)研究機構(gòu)在研制新藥過程中的每一個步驟,或許都可以提速?!叭绻懔私庾约核惴ǖ木窒扌?,并清楚如何去解讀、去提升其表現(xiàn),你就不需要那么多人手來收集和分析大量數(shù)據(jù)?!?/p>