DeepMind建立了一個人工智能系統(tǒng) 以應(yīng)對當(dāng)今生物學(xué)中最大挑戰(zhàn)之一
Alphabet Inc.的DeepMind人工智能部門已經(jīng)取得了另一項科學(xué)成就。
該組織透露,它已經(jīng)建立了一個人工智能系統(tǒng),能夠應(yīng)對當(dāng)今生物學(xué)中最大的挑戰(zhàn)之一:模擬蛋白質(zhì)的形狀。
該系統(tǒng)被稱為AlphaFold,開發(fā)時間不少于兩年。在美國國家綜合醫(yī)學(xué)科學(xué)院(U.S. National InsTItute of General Medical Sciences)舉辦的CASP模擬競賽中,該軟件輕松擊敗其他97種算法,隨后DeepMind決定宣布該項目。
幾乎在每個生物過程中都會發(fā)揮作用的蛋白質(zhì)是扭曲和折疊成各種形式的氨基酸鏈。蛋白質(zhì)的形狀是決定其行為的主要因素之一。更好地了解這些特性可以讓科學(xué)家獲得對某些疾病的新見解——這些疾病被認為是由錯誤折疊的蛋白質(zhì)引起的,而且還會發(fā)現(xiàn)可能對藥物開發(fā)有用的分子。
DeepMind表示,AlphaFold代表了朝著實現(xiàn)這一目標前進的“重大進展”。該系統(tǒng)可以根據(jù)所包含的氨基酸計算預(yù)測蛋白質(zhì)的結(jié)構(gòu),這家Alphabet的子公司表示其準確程度遠遠高于現(xiàn)有方法。如果是手動模擬平均大小的蛋白質(zhì)的每一種可能的結(jié)構(gòu),要花的時間比宇宙的年齡更長,考慮到這一事實,這種算法取得的成就就不是一件小事了。
AlphaFold將任務(wù)分解為兩部分。首先,系統(tǒng)使用有關(guān)蛋白質(zhì)的氨基酸組成的信息來生成其默認(即展開)結(jié)構(gòu)的三維模型。
DeepMind解釋說:“我們網(wǎng)絡(luò)預(yù)測的屬性是:(a)氨基酸對之間的距離和(b)連接這些氨基酸的化學(xué)鍵之間的角度?!彼麄儽硎荆骸拔覀冇?xùn)練了一個神經(jīng)網(wǎng)絡(luò)來預(yù)測蛋白質(zhì)中每對殘基之間距離的單獨分布。然后將這些概率組合成一個分數(shù),評估該蛋白質(zhì)結(jié)構(gòu)的準確程度?!?/p>
三維模型準備就緒之后,AlphaFold就會計算出該蛋白質(zhì)最有可能的形狀。所有蛋白質(zhì)傾向于折疊成盡可能最節(jié)能形式,該系統(tǒng)利用這一事實來完成這一步工作,這有助于縮小可能性。 人工智能會嘗試不同的三維模型變體,以生成更高效的版本,直至找到最佳形式。
DeepMind表示:“我們的第一種方法建立在結(jié)構(gòu)生物學(xué)中常用的技術(shù)基礎(chǔ)之上,并用新的蛋白質(zhì)片段反復(fù)替換蛋白質(zhì)結(jié)構(gòu)片段?!彼麄儽硎荆骸暗诙N方法通過梯度下降優(yōu)化得分——一種常用于機器學(xué)習(xí)的數(shù)學(xué)技術(shù),用于進行小的、漸進式的改進——以產(chǎn)生高度精確的結(jié)構(gòu)。”
據(jù)英國(The Guardian)報道,AlphaFold最初需要兩周時間才能產(chǎn)生預(yù)測,但現(xiàn)在可以在幾個小時內(nèi)完成任務(wù)。它在CASP模擬競賽提供的43種蛋白質(zhì)中,準確預(yù)測了25種,成功擊敗參與測試的其他97種算法。其中亞軍只正確預(yù)測了三個。