"算儲兼?zhèn)? 亞馬遜云科技可滿足醫(yī)療與生命科學(xué)行業(yè)的存儲需求
北京2023年8月18日 /美通社/ -- 早在16世紀(jì),近代人體解剖學(xué)創(chuàng)始人安德烈·維薩里在其著作《人體結(jié)構(gòu)》中首次描述了人體的骨骼、肌肉、血管和神經(jīng)的自然形態(tài)和分布。這一偉大成果使維薩里成為與哥白尼并列的兩大科學(xué)革命代表人物,也讓醫(yī)學(xué)和人體生物學(xué)從此擺脫中世紀(jì)神權(quán)桎梏,步入科學(xué)軌道。
以此為起點(diǎn),醫(yī)學(xué)研究一路向著更微觀的世界挺近,在歷經(jīng)發(fā)明顯微鏡,發(fā)現(xiàn)細(xì)菌,發(fā)現(xiàn)抗生素等數(shù)個里程碑之后,來到了以基因圖譜和分子式為研究對象,將人工智能(AI)和機(jī)器學(xué)習(xí)(ML)作為研究工具的精準(zhǔn)醫(yī)學(xué)時(shí)代。
相比于維薩里要靠盜尸來獲得研究"數(shù)據(jù)"的窘境,如今已游走于分子維度的精準(zhǔn)醫(yī)學(xué)卻要應(yīng)對數(shù)據(jù)爆炸帶來的難題。身處分秒不停的數(shù)據(jù)洪流之中,醫(yī)療與生命科學(xué)行業(yè)對IT基礎(chǔ)設(shè)施的核心需求之一就是以較低成本獲得龐大且可彈性擴(kuò)縮的存儲空間。這種需求也開啟了醫(yī)療與生命科學(xué)行業(yè)數(shù)據(jù)的上云之旅。
亞馬遜云科技基于醫(yī)療與生命科學(xué)行業(yè)客戶的需求不斷創(chuàng)新,不但讓他們獲得云上高性價(jià)比的彈性存儲空間,并針對存儲服務(wù)不斷創(chuàng)新以支持他們大規(guī)模的數(shù)據(jù)計(jì)算,達(dá)成"存"與"用"的性能協(xié)同。
如何滿足醫(yī)療與生命科學(xué)行業(yè)海量數(shù)據(jù)的存儲需求,并降低存儲成本?
數(shù)據(jù)量的爆炸性增長在醫(yī)療與生命科學(xué)領(lǐng)域尤為顯著。例如在藥物發(fā)現(xiàn)領(lǐng)域,科學(xué)家已發(fā)現(xiàn)的自然界里有可能成為藥物分子的個數(shù)有1060之多,相比之下,整個太陽系原子個數(shù)也只是1050左右。即便是數(shù)據(jù)指數(shù)效應(yīng)相對較弱的醫(yī)院和診所,在國內(nèi)也面對一年數(shù)十億人次診療所沉積的數(shù)字化檔案及醫(yī)學(xué)影像。
如何存儲海量數(shù)據(jù)并不斷降低存儲成本是醫(yī)療和生命科學(xué)領(lǐng)域亟需解決的一大挑戰(zhàn)。而無論從可靠性還是經(jīng)濟(jì)性,亞馬遜云科技的存儲服務(wù)都為醫(yī)療和生命科學(xué)機(jī)構(gòu)存放海量數(shù)據(jù)提供了可靠的選擇。
其中,對象存儲服務(wù)Amazon Simple Storage Service (Amazon S3)設(shè)計(jì)具有99.999999999%(11個9)的持久性,具有安全、可擴(kuò)展和按需付費(fèi)等特性,可輕松完成PB至EB級數(shù)據(jù)的存儲。為了更經(jīng)濟(jì)、高效地存儲客戶的數(shù)據(jù),亞馬遜云科技持續(xù)對 Amazon S3進(jìn)行創(chuàng)新。例如,Amazon S3的存儲層級多達(dá)8級,讓客戶可根據(jù)工作負(fù)載對數(shù)據(jù)訪問、恢復(fù)能力和成本等方面的需求來進(jìn)行選擇;Amazon S3智能分層( Intelligent-Tiering )在不影響性能的前提下,能夠在數(shù)據(jù)訪問模式發(fā)生變化時(shí)自動節(jié)省存儲成本。自2018年推出 Amazon S3 Intelligent-Tiering 以來,客戶使用該功能已經(jīng)節(jié)省了 10 億美元。
醫(yī)療與生命科學(xué)行業(yè)大規(guī)模、高并發(fā)的數(shù)據(jù)計(jì)算需要高性能的存儲服務(wù)
海量數(shù)據(jù)為基因診斷、基因治療、靶向藥物研發(fā)等奠定了精準(zhǔn)醫(yī)學(xué)發(fā)展的基礎(chǔ),而大規(guī)模的數(shù)據(jù)計(jì)算則推進(jìn)精準(zhǔn)醫(yī)學(xué)的發(fā)展。例如單次數(shù)據(jù)分析所涉及的樣本數(shù)量可能超過數(shù)萬或數(shù)十萬,可能需調(diào)用底層成百上千甚至上萬個計(jì)算實(shí)例,這對存儲數(shù)據(jù)的存儲服務(wù)提出更高的數(shù)據(jù)吞吐性能要求。
為了確保存儲服務(wù)性能足以支持大規(guī)模、高并發(fā)計(jì)算集群的要求,亞馬遜云科技提供了一項(xiàng)完全托管式的文件存儲服務(wù)Amazon FSx for Lustre,為高性能計(jì)算工作負(fù)載提供經(jīng)濟(jì)高效、高性能且可擴(kuò)展的支持。Amazon FSx for Lustre可將文件系統(tǒng)連接至多個Amazon S3存儲桶,無縫訪問Amazon S3中的數(shù)據(jù),優(yōu)化計(jì)算資源的吞吐量。同時(shí)Amazon FSx for Lustre與亞馬遜云科技的計(jì)算服務(wù)高度集成,可提供亞毫秒級延遲、高達(dá)每秒數(shù)百GB吞吐量和數(shù)百萬的IOPS,能夠同時(shí)給上千臺運(yùn)行PB級數(shù)據(jù)復(fù)雜分析工作負(fù)載的計(jì)算實(shí)例提供支持,并且將分析結(jié)果的數(shù)據(jù)同步回寫至Amazon S3中。
對于醫(yī)療與生命科學(xué)行業(yè)所涉及的大規(guī)模計(jì)算工作負(fù)載,Amazon FSx for Lustre相當(dāng)于在對象存儲與計(jì)算集群之間加入了高性能緩存層,為存儲、計(jì)算兩端實(shí)現(xiàn)高效率的雙向數(shù)據(jù)同步;并且用戶無需在設(shè)置和管理Lustre文件系統(tǒng)上花費(fèi)精力,就能夠獲得充足的算力支持和更短的計(jì)算周期,并節(jié)省人力與計(jì)算成本。
位于上海的腫瘤精準(zhǔn)醫(yī)學(xué)企業(yè)桐樹基因,采用二代高通量測序技術(shù)進(jìn)行腫瘤基因檢測,單個樣本可以產(chǎn)生108至109的短序列片段,每個序列片段又約是150個基因堿基長度,單個樣本的文件大小可達(dá)10GB到30GB。隨著業(yè)務(wù)發(fā)展和樣本量增長,桐樹基因選擇遷移至亞馬遜云科技以解決對存儲、I/O和算力的要求。此后,桐樹科技一方面獲得Amazon S3的高性價(jià)比存儲服務(wù),另一方面也借助Amazon FSx for Lustre 為基因測序流程提供高性能共享文件存儲,使單個樣本分析時(shí)間縮短30-40分鐘,批量樣本分析整體用時(shí)較過去節(jié)省達(dá)三分之二。
亞馬遜云科技豐富的存儲服務(wù),滿足醫(yī)療與生命科學(xué)行業(yè)的多樣化需求
在醫(yī)療與生命科學(xué)行業(yè),相對于初創(chuàng)企業(yè)從業(yè)務(wù)之初即原生上云,也有不少機(jī)構(gòu)需要將本地?cái)?shù)據(jù)存儲向云上遷移。對此,亞馬遜云科技不斷豐富"專門構(gòu)建"的Amazon FSx文件存儲系列服務(wù),幫助用戶在遷移時(shí)無需重構(gòu)應(yīng)用,就能繼續(xù)使用熟悉的文件管理系統(tǒng)。
除了Amazon FSx for Lustre,Amazon FSx文件存儲系列服務(wù)還包括Amazon FSx for Windows File Server,基于開源OpenZFS文件系統(tǒng)構(gòu)建的Amazon FSx for OpenZFS,以及Amazon FSx for NetApp ONTAP。例如,對于使用NetApp ONTAP文件存儲在線下構(gòu)建了自己的數(shù)據(jù)管理和應(yīng)用的醫(yī)療與生命科學(xué)行業(yè)用戶。這些企業(yè)在數(shù)據(jù)存儲遷移上云時(shí),可使用Amazon FSx for NetApp ONTAP,無需修改其應(yīng)用和數(shù)據(jù)管理方式,即可將部署在本地?cái)?shù)據(jù)中心的網(wǎng)絡(luò)文件存儲(NAS)設(shè)備上的應(yīng)用遷移至亞馬遜云科技,繼續(xù)使用自己熟悉的方式在云端部署、管理應(yīng)用和數(shù)據(jù),同時(shí)獲得FSx for NetApp ONTAP與亞馬遜云科技其它云服務(wù)之間的無縫集成。
亞馬遜云科技安全的數(shù)據(jù)保護(hù)功能,助力醫(yī)療與生命科學(xué)行業(yè)快速創(chuàng)新
此外,亞馬遜云科技的所有存儲服務(wù)都具有多重安全功能,并已通過權(quán)威的國際和本地技術(shù)測評與認(rèn)證,遵守嚴(yán)格的國際和本地合規(guī)原則。同時(shí),亞馬遜云科技還提供豐富的數(shù)據(jù)保護(hù)功能,實(shí)現(xiàn)關(guān)鍵數(shù)據(jù)的備份、容災(zāi)、一站式管理和快速恢復(fù),包括對不同應(yīng)用和數(shù)據(jù)源的一站式數(shù)據(jù)備份,跨區(qū)域遠(yuǎn)程復(fù)制服務(wù),以及多種數(shù)據(jù)快速恢復(fù)功能。亞馬遜云科技安全及豐富的數(shù)據(jù)保護(hù)功能,讓醫(yī)療與生命科學(xué)客戶可以更輕松滿足行業(yè)本身更高的安全與合規(guī)要求,將精力聚焦于業(yè)務(wù)創(chuàng)新上。
借助亞馬遜云科技提供的存儲服務(wù),醫(yī)療與生命科學(xué)行業(yè)客戶無論是海量數(shù)據(jù)存儲,還是進(jìn)行基因研究、藥物分子篩選等大規(guī)模的數(shù)據(jù)計(jì)算,都能獲得更優(yōu)成本、卓越性能,以及滿足細(xì)分場景需求的多樣化解決方案,快速驅(qū)動業(yè)務(wù)的創(chuàng)新發(fā)展。