亞馬遜加入NIH的STRIDES計(jì)劃,意在促進(jìn)生物醫(yī)學(xué)的創(chuàng)新研究
2018年10月25日,獲悉,AWS(亞馬遜網(wǎng)絡(luò)服務(wù))將加入NIH(美國(guó)國(guó)立衛(wèi)生研究院)STRIDES(發(fā)現(xiàn)、實(shí)驗(yàn)和可持續(xù)性的科學(xué)和技術(shù)研究基礎(chǔ)設(shè)施)計(jì)劃,利用AWS云端的先進(jìn)技術(shù)促進(jìn)生物醫(yī)學(xué)的創(chuàng)新研究。
STRIDES計(jì)劃于2018年7月推出,旨在為NIH生物醫(yī)學(xué)研究人員提供商業(yè)云計(jì)算服務(wù)。最初,NIH的工作重點(diǎn)是幫助研究人員獲得高價(jià)值數(shù)據(jù)集,并嘗試用新的方法來優(yōu)化技術(shù)密集型研究。 STRIDES計(jì)劃是NIH共同基金數(shù)據(jù)管理新模式(NMDS)的組成部分,NMDS的另一組成部分是NIH數(shù)據(jù)共享測(cè)試計(jì)劃,該計(jì)劃旨在測(cè)試將高價(jià)值生物醫(yī)學(xué)數(shù)據(jù)集納入云計(jì)算系統(tǒng),建立和評(píng)估使用數(shù)據(jù)的最佳方法。AWS是繼Google Cloud之后加入STRIDES計(jì)劃的第二家云服務(wù)提供商。
AWS是亞馬遜的子公司,它以付費(fèi)訂閱的方式向政府、公司和個(gè)人提供按需云計(jì)算平臺(tái)服務(wù),該服務(wù)始終允許訂閱用戶通過網(wǎng)絡(luò)訪問虛擬計(jì)算機(jī)數(shù)據(jù)集。
NIH與AWS達(dá)成的協(xié)議將幫助NIH研究人員以及全國(guó)2500多所學(xué)術(shù)機(jī)構(gòu)的研究人員獲得NIH的資助以及AWS的一系列技術(shù)。STRIDES項(xiàng)目的負(fù)責(zé)人希望通過與AWS這類的商業(yè)云服務(wù)提供商(CSP)合作提供的數(shù)據(jù)能夠達(dá)到生物醫(yī)學(xué)研究界認(rèn)可的可查找、可訪問、可互操作和可重用(FAIR)的標(biāo)準(zhǔn)。
他們還希望AWS直接與NIH及其資助的研究人員合作,開發(fā)和測(cè)試新的方法,組建更多的數(shù)據(jù)集和相關(guān)的計(jì)算工具,供更廣泛的研究群體使用和訪問。CSP和NIH 數(shù)據(jù)共享測(cè)試階段的研究人員將為三個(gè)測(cè)試用數(shù)據(jù)集建立云存儲(chǔ)服務(wù),同時(shí)設(shè)置準(zhǔn)則、制度和流程。在完成一系列試點(diǎn)計(jì)劃以及修訂該計(jì)劃的制度和程序后,這項(xiàng)服務(wù)將提供給NIH資助的研究機(jī)構(gòu)。
NIH資助的三個(gè)測(cè)試用數(shù)據(jù)集是基于他們?cè)谏镝t(yī)學(xué)研究界的價(jià)值、數(shù)據(jù)的多樣性以及基礎(chǔ)研究和臨床研究的覆蓋率而決定的。
目前,這三個(gè)數(shù)據(jù)集包括以下內(nèi)容:基因型——組織表達(dá) (GTEx)數(shù)據(jù)集,GTEx數(shù)據(jù)集探索人類基因在不同組織中的表達(dá)和調(diào)控方式,以及基因組變異在改變基因表達(dá)中的作用;基因組資源整合(AGR),AGR數(shù)據(jù)集由6個(gè)MOD(模型生物數(shù)據(jù)庫(kù))組成,MOD為模式生物的深度研究提供深層次的生物學(xué)數(shù)據(jù);精準(zhǔn)醫(yī)學(xué)的Trans-Omics(TOPMed),TOPMed數(shù)據(jù)集收集并配對(duì)全基因組測(cè)序(WGS)。