阿里達(dá)摩院又火了!AI算法分析病毒基因,僅需半小時(shí)!
阿里巴巴達(dá)摩院正在用AI算法抗擊新型冠狀病毒肺炎疫情。2月1日,浙江省疾控中心上線自動(dòng)化的全基因組檢測(cè)分析平臺(tái)。利用阿里達(dá)摩院研發(fā)的AI算法,可將原來數(shù)小時(shí)的疑似病例基因分析縮短至半小時(shí),大幅縮短確診時(shí)間,并能精準(zhǔn)檢測(cè)出病毒的變異情況。
達(dá)摩院算法專家顧斐博士在疾控中心基因檢測(cè)分析現(xiàn)場(chǎng)
當(dāng)前,全國(guó)新型冠狀病毒肺炎疫情依然嚴(yán)峻,快速、精確診斷對(duì)于疫情控制尤其重要。公開信息顯示,該病毒是基因組序列最長(zhǎng)的病毒之一,全基因組序列全長(zhǎng)29847bp,臨床診斷需要將患者樣本與該病毒基因序列進(jìn)行比對(duì)才能確定診斷結(jié)果。
目前醫(yī)院普遍采用核酸檢測(cè)方法,其只能檢測(cè)到病毒基因的局部。由于病毒存在變異的可能性,對(duì)于整個(gè)基因序列來說這種檢測(cè)方法猶如盲人摸象,一旦病毒發(fā)生變異,就可能出現(xiàn)漏檢的情況。
新型冠狀病毒結(jié)構(gòu)
不同于傳統(tǒng)核酸檢測(cè)方法,全基因組檢測(cè)技術(shù)可以對(duì)疑似病例的病毒樣本進(jìn)行全基因組序列分析比對(duì),能夠有效防止病毒變異產(chǎn)生的漏檢。此次阿里巴巴達(dá)摩院與杰毅生物技術(shù)公司聯(lián)合研發(fā)的平臺(tái)采用的就是全基因組檢測(cè)方法,其突破之處在于大幅縮短了檢測(cè)時(shí)間。
在基因分析階段,阿里巴巴達(dá)摩院和阿里云彈性計(jì)算團(tuán)隊(duì)提供的系統(tǒng)還能提供病毒快速拼接能力,將快速精準(zhǔn)捕捉變異后的病毒序列,二級(jí)結(jié)構(gòu)及三維結(jié)構(gòu),為病毒疫苗和藥物提供了基礎(chǔ)。
設(shè)置基因檢測(cè)分析參數(shù)
診斷效率的提升得益于算法的創(chuàng)新。達(dá)摩院團(tuán)隊(duì)針對(duì)新型冠狀病毒基因進(jìn)行特征分析,并推出多個(gè)算法模型。在序列比對(duì)過程中,達(dá)摩院對(duì)算法增加了分布式設(shè)計(jì),提升了比對(duì)效率;在病毒序列拼接階段使用分布式設(shè)計(jì)的de Bruijn圖算法,變異病毒也能精準(zhǔn)檢測(cè)。
浙江省疾控中心基因測(cè)序負(fù)責(zé)人孫逸博士表示:“該平臺(tái)基于阿里云的強(qiáng)大算力與達(dá)摩院新算法可以為病毒的解析提供支撐,基于該平臺(tái),未來還可以在短時(shí)間內(nèi)將檢測(cè)范圍覆蓋整個(gè)確診病例,也為后續(xù)疫苗與藥物研發(fā)打下了堅(jiān)實(shí)基礎(chǔ)。”