AI正全軍出擊 進(jìn)駐抗生素新藥研發(fā)的戰(zhàn)場(chǎng)
抗生素帶給人類的福澤,無論給出多少溢美之詞都不過分??股卦趹?yīng)用初期,被人們認(rèn)為是幾乎“包治百病”的靈丹妙藥,成為20世紀(jì)人類最偉大的成就之一。
然而到了今天,全球每年約有50%的抗生素被濫用,在中國(guó)這一比例甚至接近80%。家有兒女的人們恐怕更有切身體驗(yàn),只要孩子頭疼腦熱總要上醫(yī)院打點(diǎn)滴,大多里面都使用了抗生素。人們對(duì)于“見效快”的執(zhí)念所造成的直接后果就是讓細(xì)菌更具抗藥性,可能以往發(fā)揮作用的抗生素,會(huì)因?yàn)榧?xì)菌抗藥性的增加而失效。
對(duì)于抗生素寄予厚望的普通人可以會(huì)想:科學(xué)家只要找到比產(chǎn)生抗藥性細(xì)菌的更強(qiáng)的抗生素就可以了。事實(shí)上科學(xué)家們確實(shí)是這么干,但抗生素的研究遠(yuǎn)非人們想象中那么簡(jiǎn)單。
那對(duì)更心急、更癡迷“銀彈思維”的吃瓜群眾來說,總是還想打破砂鍋地問一句:有沒有可能找到一種有效消滅大量有害細(xì)菌的抗生素呢?從生物規(guī)律上來講,這有點(diǎn)癡心妄想。但目標(biāo)總是要有的,萬一接近了呢?
求瓜得瓜。2月20日,全球著名的自然科學(xué)類期刊《細(xì)胞》(Cell)發(fā)表了一篇題為“一種發(fā)現(xiàn)抗生素的深度學(xué)習(xí)方法”的研究論文,報(bào)道了麻省理工學(xué)院(MIT)的研究團(tuán)隊(duì)利用深度學(xué)習(xí)模型發(fā)現(xiàn)了一種超強(qiáng)抗生素Halicin。經(jīng)試驗(yàn)研究,這種新型抗生素化合物對(duì)多種耐藥菌有殺菌效果,具有廣譜抗菌效應(yīng)。當(dāng)然這一研究的亮點(diǎn)在于新的研究方法,即通過AI的深度學(xué)習(xí)算法從大型合成化學(xué)分子庫中找到了這一獨(dú)特的分子結(jié)構(gòu)。
AI在藥物研發(fā)上面的能力已經(jīng)不是什么稀罕事,但發(fā)現(xiàn)抗生素還是第一次。好奇心一定會(huì)驅(qū)使我們繼續(xù)追問下去:為什么人類研發(fā)抗生素的速度抵不過細(xì)菌抗藥性的增長(zhǎng)速度?AI開拓出抗生素研發(fā)的路徑對(duì)于醫(yī)學(xué)來說又意味著什么?
抗生素發(fā)現(xiàn)的謎題,為什么人類的路越走越窄?
從1928年,弗萊明發(fā)現(xiàn)第一種抗生素青霉素起幾十年間,此后科學(xué)家們又陸續(xù)發(fā)現(xiàn)了100多種抗生素。但從1987年起一直到2015年,整整28年間,人類卻再也沒有發(fā)現(xiàn)新的抗生素。
為什么新型抗生素的發(fā)現(xiàn)越來越慢,甚至出現(xiàn)了如此長(zhǎng)的一段空檔期?可以說,我們目前所使用的主要的幾種抗生素都是四五十年代發(fā)現(xiàn),且都是從土壤中的微生物種群中篩選和培養(yǎng)。大約99%的細(xì)菌種群之前是無法在實(shí)驗(yàn)室中單獨(dú)培養(yǎng),這一限制條件讓人們無法單獨(dú)分離出細(xì)菌生產(chǎn)的潛在的有效的抗生化合物。
從上世紀(jì)60年代以后,從微生物種群中尋找新的抗生素的速度明顯放緩,取而代之的是“半合成抗生素”。如今以青霉素、頭孢菌素為主體的β一內(nèi)酰胺類抗生素,已經(jīng)成為最主要的化學(xué)治療藥劑。
一直到2015年,美國(guó)科學(xué)家才發(fā)現(xiàn)了一種新型抗生素泰斯巴汀(Teixobactin)。這一抗生素實(shí)現(xiàn)了抗菌藥物領(lǐng)域的一大突破,可以殺死多種致命病原體,同時(shí)病原體很難對(duì)其發(fā)展出抗藥性。這一科學(xué)進(jìn)展得益于細(xì)菌培育技術(shù)的進(jìn)步。研究人員通過一種稱為iChip的電子芯片設(shè)備,可以將目標(biāo)細(xì)菌分離并分別在比實(shí)驗(yàn)室更自然的土壤環(huán)境中生長(zhǎng),從而讓只有1%成長(zhǎng)機(jī)會(huì)的細(xì)菌提升到50%。
盡管如此,發(fā)現(xiàn)新的抗生素的效率仍然還是太低了,而且經(jīng)過大規(guī)模投入培養(yǎng)出的抗生素很可能還是舊的抗生素,或者不具有很好的抗菌活性。那這次為什么AI就能做到呢?
窺斑見豹:新型抗生素探尋的AI新路徑
由于傳統(tǒng)的抗生素藥物培育的低效,從大型合成化學(xué)文庫的篩選抗生素分子結(jié)構(gòu)成為一種新思路。但這些文庫可能包含幾十萬到幾百萬個(gè)化學(xué)分子,但分子式的化學(xué)多樣性有限,且無法反映抗生素分子可能的化學(xué)性質(zhì)。一來是人工篩選的工作量極大成本過高,再則是面臨難以驗(yàn)證化合物多樣性的限制。
從分子庫中篩選對(duì)某種細(xì)菌能夠產(chǎn)生抑制性的分子,再去驗(yàn)證這些分子與已經(jīng)應(yīng)用的抗生素的差異。其中包括了海量的計(jì)算與重復(fù)實(shí)驗(yàn),讓這一辦法對(duì)于人類研究者確實(shí)太不友好了。
但這次,AI作為一種新的研究手段引入對(duì)這些合成化學(xué)分子的篩查,讓發(fā)現(xiàn)抗生素引來重大轉(zhuǎn)機(jī)。研究人員提出了將結(jié)構(gòu)分析和篩選相結(jié)合的思路,利用機(jī)器學(xué)習(xí)算法從分子性質(zhì)中預(yù)測(cè)具有潛在抗菌性能的化合物。這一次大獲成功。
首先,研究者以抑制某種大腸桿菌為目標(biāo)進(jìn)行篩選,選取了2335種FDA已經(jīng)批準(zhǔn)的藥物分子或自然化合物分子,再以80%生長(zhǎng)抑制率為標(biāo)準(zhǔn),將它們分為有抑菌性和沒有抑菌性兩類,作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集。
同時(shí),他們采用了一種“有向消息傳遞深度神經(jīng)網(wǎng)絡(luò)”(DMP-DNN)的算法,將化合物的原子和成鍵等信息以連續(xù)向量的方式多次重復(fù)傳遞,從而獲取更高級(jí)的表征結(jié)果。這一神經(jīng)網(wǎng)絡(luò)是通過自學(xué)習(xí)向量來表征分子,而不需要人為標(biāo)注特定的分子結(jié)構(gòu)。
有向信息傳遞網(wǎng)絡(luò)能直接從分子的圖結(jié)構(gòu)預(yù)測(cè)分子的屬性,經(jīng)過固定次數(shù)的信息傳遞步驟,最終形成的分子的單個(gè)向量就可以進(jìn)行對(duì)細(xì)菌的抑制率的預(yù)測(cè)。這種窺斑見豹的方式,大大的縮短了篩選路徑,也降低了對(duì)于算力、時(shí)間等等成本的消耗。
(除了銅綠假單胞菌(底部藍(lán)色)外,Halicin在幾種耐藥菌測(cè)試中,顯示了良好的廣譜抗菌活性)
隨后,將訓(xùn)練過的深度學(xué)習(xí)模型應(yīng)用到博德研究所的包含約1億分子量的DRH化合物庫中進(jìn)行篩選,該模型從6111個(gè)正處于研究階段的藥物分子里,選出了99種最有可能存在抑菌性的化合物。
最后,經(jīng)過實(shí)驗(yàn)結(jié)果證實(shí),其中的51種能明顯抑制該類大腸桿菌生長(zhǎng)。從中選出了這種被命名為Halicin的化合物,因其低體內(nèi)毒性和結(jié)構(gòu)新穎性,成為最有潛力的新型抗生素。
此后研究者將在再次訓(xùn)練過的深度學(xué)習(xí)模型應(yīng)用在了規(guī)模更大的ZINC15藥物小分子數(shù)據(jù)庫上,對(duì)約一億化合物的預(yù)測(cè)和篩選,又發(fā)現(xiàn)了新的潛在的抗生素結(jié)構(gòu)。而這一篩選過程,也僅僅只用了三天。
可見在深度學(xué)習(xí)的幫助下,6111個(gè)藥物分子被篩選成99個(gè),對(duì)這99個(gè)藥物分子再進(jìn)行試驗(yàn),效率自然快得多。
這一開創(chuàng)性研究標(biāo)志著抗生素發(fā)現(xiàn)乃至更普遍的新藥挖掘方法發(fā)生了范式轉(zhuǎn)變。那AI的加入到底會(huì)帶來哪些更多的價(jià)值呢?
抗生素新藥研發(fā)的戰(zhàn)場(chǎng),AI正全軍出擊
一般來說,傳統(tǒng)的藥物的研發(fā)主要經(jīng)歷這四個(gè)階段:
1、靶點(diǎn)的選擇和確認(rèn);2、先導(dǎo)化合物的發(fā)現(xiàn)和優(yōu)化;3、臨床前研究;4、臨床試驗(yàn)。之后才可以正式被批準(zhǔn)上市。一款新藥從研發(fā)到上市面臨3個(gè)“10”的考驗(yàn):10年時(shí)間、10億美金、10%成功率,而且這一趨勢(shì)更為嚴(yán)重。對(duì)于抗生素的研發(fā),也面臨著同樣的長(zhǎng)時(shí)間高投入、低產(chǎn)出低利潤(rùn)的問題。
在AI特別是深度學(xué)習(xí)算法的幫助下,藥物研發(fā)正在迎來新的轉(zhuǎn)機(jī)。從目前AI已經(jīng)在投入應(yīng)用的新藥研制,以及這一次AI在新的抗生素化合物分子的發(fā)現(xiàn)上,都表現(xiàn)出非常明顯的效果??梢哉f,未來AI在新藥物挖掘、化合物篩癬靶點(diǎn)發(fā)現(xiàn)和藥物有效性預(yù)測(cè)等方面都將起到極大的輔助作用,一定程度上提高研發(fā)效率、節(jié)約資金以及降低臨床試驗(yàn)的失敗風(fēng)險(xiǎn)。
現(xiàn)代藥物研發(fā)首先最關(guān)鍵的就是藥物標(biāo)靶的尋找和識(shí)別。藥物靶點(diǎn)是指藥物在體內(nèi)的作用結(jié)合位點(diǎn),包括基因位點(diǎn)、受體、酶、離子通道、核酸等生物大分子。選擇確定新穎的有效藥靶是新藥開發(fā)的首要任務(wù)。引入AI技術(shù)之前,傳統(tǒng)抗生素作用新靶點(diǎn)的篩查基于基因組、抑制蛋白質(zhì)合成、合成酶等方法,其困難在于人工篩選試驗(yàn)效率低下,進(jìn)展緩慢。而通過AI的深度學(xué)習(xí)模型的介入,可以更快地?cái)?shù)以千萬計(jì)的科學(xué)文獻(xiàn)的非結(jié)構(gòu)數(shù)據(jù)以及這些生物的基因分子中找到可能合適的靶點(diǎn)。再通過選擇不同的靶點(diǎn)并進(jìn)行驗(yàn)證,以了解靶點(diǎn)的生物學(xué)特性,實(shí)時(shí)交互得到有證據(jù)的結(jié)果,實(shí)現(xiàn)相應(yīng)藥物靶點(diǎn)的發(fā)現(xiàn)。
再則,AI在新藥物的化合物篩選上面也同樣高效而準(zhǔn)確。此次Halicin這一高活性化合物發(fā)現(xiàn),正是根據(jù)具體的藥物靶向需求,采用靈活的模型算法,在數(shù)千種可能的分子合成物中有效篩選可能的藥物分子結(jié)構(gòu),極大節(jié)省了篩選時(shí)間和成本。
另外,除了在新藥物靶點(diǎn)發(fā)現(xiàn)以及高活性化合物的發(fā)現(xiàn)外,AI在小分子藥物自動(dòng)合成路線的設(shè)計(jì)、新藥物效果模擬和預(yù)測(cè),甚至新型藥物分子的預(yù)測(cè)上面都有實(shí)際應(yīng)用的實(shí)踐。這對(duì)于無論是抗生素藥,還是更普遍的藥物的研發(fā)都將帶來巨大的契機(jī)。
在新藥研發(fā)領(lǐng)域有一個(gè)形象的說法,那些“低垂的果實(shí)“都已經(jīng)被摘完了,未來的新藥研發(fā)需要去被茂密的樹枝和樹葉阻擋的果樹高處去摘取果實(shí)。而AI可能正是抵達(dá)這些樹枝身處摘取果實(shí)的最好階梯。