希望科學(xué)界最大限度的發(fā)揮,IBM 將治愈癌癥三個 AI 項目發(fā)布在開源社區(qū)
如果我們在分子層面上更深入地了解癌癥,就能學(xué)會更有效地治療癌癥。
IBM已向開源社區(qū)發(fā)布了旨在克服治愈癌癥這個挑戰(zhàn)的三個AI項目。
在本月晚些時候?qū)⒃谌鹗颗e行的第18屆歐洲計算生物學(xué)大會(ECCB)和第27屆分子生物學(xué)智能系統(tǒng)大會(ISMB)上,這個技術(shù)巨頭將深入探討每一個項目如何促進(jìn)我們對于癌癥及治療方法的了解。
據(jù)估計,單單癌癥在2018年就奪去了960萬條生命,同年報告的新病例估計多達(dá)1800萬例。
遺傳傾向性以及環(huán)境因素(包括污染、吸煙和飲食)都被認(rèn)為是加大人們患癌癥的可能性的因素;雖然我們可以治療多種癌癥,但還有很多地方有待研究。
位于蘇黎世的IBM計算系統(tǒng)生物學(xué)小組的研究人員致力于研究AI和機(jī)器學(xué)習(xí)方法,以“幫助我們加快了解這些復(fù)雜疾病的主要誘因和分子機(jī)制”,并研究提高我們對腫瘤構(gòu)成的認(rèn)識的方法。
IBM稱:“我們的目標(biāo)是加深對癌癥的了解,讓諸多行業(yè)和學(xué)術(shù)界掌握可能有一天有助于推動新治療和新療法的知識。”
第一個項目名為PaccMann(切勿與流行的Pac-Man計算機(jī)游戲混為一談),聲稱可以“利用基于注意力的多模式神經(jīng)網(wǎng)絡(luò)來預(yù)測抗癌化合物的敏感性。”
單單研制一種抗癌藥可能就要耗資數(shù)百萬美元,財力上的這種限制會使我們研發(fā)新藥物和新療法的項目推遲或泡湯。
IBM正致力于開發(fā)PaccMann算法,以自動分析化合物,并預(yù)測哪些化合物最有可能對抗癌癥菌株,這可能有望簡化這個過程。
機(jī)器學(xué)習(xí)算法利用基因表達(dá)方面的數(shù)據(jù)和化合物的分子結(jié)構(gòu)。IBM稱,通過更早地識別潛在的抗癌化合物,這可以降低與藥物開發(fā)有關(guān)的成本。
第二個項目名為“Interaction Network infErence from vectoR representATions of words”(簡稱INtERAcT)。這個工具特別值得關(guān)注,因為它可以從與我們對癌癥的了解有關(guān)的有價值的科學(xué)文獻(xiàn)中自動提取數(shù)據(jù)。
每年癌癥研究領(lǐng)域發(fā)表的論文大約有17000篇,就算并非沒有可能,研究人員至少很難跟得上我們在理解能力上邁出的每一小步。
INtERAcT旨在通過自動從這些論文中提取信息,為研究的學(xué)術(shù)方面減輕負(fù)擔(dān)。目前,該工具正接在受測試,用來提取與蛋白質(zhì)-蛋白質(zhì)相互作用有關(guān)的數(shù)據(jù)——蛋白質(zhì)-蛋白質(zhì)的相互作用已被認(rèn)為是包括癌癥在內(nèi)的多種疾病中生物過程受到擾亂的潛在原因。
IBM稱:“INtERAcT的一個特殊的優(yōu)勢在于,它能夠結(jié)合某種疾病的環(huán)境來推斷相互作用。通過與健康組織中的正常相互作用進(jìn)行一番比較,可能有助于深入了解疾病機(jī)制。”
第三個也是最后一個項目是“路徑誘導(dǎo)的多核學(xué)習(xí)”(即PIMKL)。該算法利用描述我們目前在分子相互作用方面所知道的情況的數(shù)據(jù)集,以便預(yù)測癌癥的進(jìn)展和患者的潛在復(fù)發(fā)。
PIMKL使用所謂的多核學(xué)習(xí)來識別對于患者分門別類而言至關(guān)重要的分子路徑,從而為醫(yī)療保健專業(yè)人員提供個性化和定制治療方案的機(jī)會。
PaccMann和INtERAcT的代碼已經(jīng)發(fā)布,可以在這兩個項目的官網(wǎng)上找到。PIMKL已部署在IBM云上,源代碼也已發(fā)布。
每個項目都是開源的,現(xiàn)已開放供公眾使用。IBM希望通過向其他研究人員和學(xué)者提供源代碼,科學(xué)界可以最大限度地發(fā)揮其潛在的影響。