7月9日消息 據有關統(tǒng)計:傳統(tǒng)藥物研發(fā)耗時耗力,一般需要超過 15 年,耗資 30 多億美元,但每年上市的原創(chuàng)新藥僅十幾種。目前,已知的 4000 多種疾病中 90% 尚無藥可治。
如何加速新藥研發(fā)?騰訊表示,為解決困難,開始做些嘗試——發(fā)布首個 AI 驅動的藥物發(fā)現(xiàn)平臺 “云深智藥(iDrug)”。它致力于幫助用戶大幅度減少尋找潛在活性藥物的時間和成本?!霸粕睢痹醋蕴圃姷?“只在此山中,云深不知處”,新藥的發(fā)現(xiàn)過程正是如此。
基于騰訊 AI Lab 自主研發(fā)的深度學習算法,提供數(shù)據庫和云計算支持,能覆蓋臨床前新藥研發(fā)全部流程的五大模塊。
騰訊表示,其 AI Lab 自研的預測蛋白質結構的新思路,該算法在 2020 年起加入行業(yè)頂級評估平臺 CAMEO(全球唯一的蛋白質結構預測自動評估平臺)。
目前平臺上已經運行十個左右研發(fā)項目——包括對抗新冠病毒藥物的虛擬篩選和性質預測,目前篩選得到的化合物在實驗驗證中。
平臺如何為藥物研發(fā)加速助力?
疾病的形成由很多物質組成,最終形成疾病的關鍵蛋白,我們把它設為靶點。
解決靶點,就有可能解決疾病。
而解決靶點,就需要知道它的蛋白結構,再去找到對應的藥物破解它。
了解關鍵蛋白的結構,設計藥物分子來抑制它的功能,疾病就會解除。
過去通過實驗尋找針對疾病靶點的有效藥物,往往難度大、周期長、費用高。
從進入臨床試驗的行業(yè)案例來看,在新藥研發(fā)中,AI 技術最快可以將新藥發(fā)現(xiàn)周期從 3-6 年縮短到 6 個月至 1 年;從技術層面看,云深智藥平臺同樣具備相似的能力。它能最快的時間,模擬鎖的結構。
結合 AI 深度學習模型預測的蛋白質結構以及蛋白質功能(蛋白質折疊),就可以有針對性地設計藥物分子來抑制它的功能,將疾病通路阻斷。
基于自監(jiān)督學習的蛋白質折疊方法,不依賴同源序列,而是直接從序列數(shù)據庫中通過自監(jiān)督學習,學得共進化的模式,從而能夠從無到有地產生出含有共進化信息的偽同源序列,并最終讓這些蛋白能夠有效折疊。
通過一種基于深度學習的可迭代方法,有效整合模板建模與自由建模,首次提出了動態(tài)的、可迭代的氨基酸對特異性的約束條件,顯著提高了建模的精度,從而更好的折疊蛋白。
云深智藥平臺,不僅可以根據鎖的類型和形狀來設計或者選擇合適的候選鑰匙,還能吸收其他人開鎖經驗,能極大節(jié)省人力物力。
可通過 AI“遷移 ”從其他靶點上面學習到的知識(如分子局部結構對靶點結合強度的影響),應用在目標靶點上來提高模型預測精度。
目前該算法在數(shù)千個實驗數(shù)據集上預測精度(預測活性與實驗測量活性的相關性)的中位數(shù)從目前最高記錄 0.36 提升到 0.42,且篩選可用模型的百分比從 56% 提升到 60%。
獲悉,平臺還支持 ADMET 性質預測功能(藥物的吸收、分配、代謝、排泄和毒性),目前已經開源。該平臺藥物小分子 ADMET 屬性預測模塊已在多個數(shù)據集上比學術界現(xiàn)有最好模型提高 3%~11%;在合作伙伴的反饋中,平臺的自研算法精度超過現(xiàn)有商業(yè)軟件 6%~37% 不等。
當然,除了上述在算法領域不斷創(chuàng)新,平臺還提供算力和數(shù)據庫的一體化服務支撐。
數(shù)據方面,分子大數(shù)據是藥物研發(fā)中的基礎設施。
云深智藥平臺使用的分子大數(shù)據,基于現(xiàn)有公開數(shù)據集,進行了多個環(huán)節(jié)的精細清洗整理工作,得到可以用于直接構建深度學習模型的藥物分子大數(shù)據集。
算力方面,騰訊云為云深智藥平臺提供數(shù)據庫服務。
藥企、科研機構登錄平臺即可開展研究,不需要再自行部署計算資源,從而能盡快將 AI 能力引入現(xiàn)有的研發(fā)流程中。