“AI的‘燃料’是數(shù)據(jù)。”近日,在超聲大數(shù)據(jù)與人工智能應用與推廣大會上,上海交通大學附屬瑞金醫(yī)院教授詹維偉打了一個形象的比喻,他說,驅(qū)動AI落地臨床,數(shù)據(jù)的可用性起著基礎性的作用。
“頂級期刊刊發(fā)的關(guān)于醫(yī)學影像AI的論文大多需要大樣本(10萬以上)數(shù)據(jù)庫訓練?!闭簿S偉說,海量的數(shù)據(jù)意味著數(shù)據(jù)可用、不被污染、且能實現(xiàn)標準化。
而事實上,中國的醫(yī)學數(shù)據(jù)看似很多,但是可用性并不高,正是因為存在被污染、信息不健全、難以標準化的三大“痛點”。東南大學生物科學與醫(yī)學工程學院教授萬遂人表示,在多中心的數(shù)據(jù)庫建立過程中,經(jīng)常出現(xiàn)對同一醫(yī)學問題的不同說法。他認為需要經(jīng)過幾年的時間,完成行業(yè)標準的工作。
另一方面數(shù)據(jù)的不統(tǒng)一還存在一定的客觀原因,例如不同品牌的儀器成像機理和標準不同,因此對于同一病灶輸出的影像并不相同,這也大大提高了數(shù)據(jù)庫標準化的難度。
為此專家呼吁相關(guān)機構(gòu)進行數(shù)據(jù)的標準化工作?!罢麄€醫(yī)學人工智能的基礎是大數(shù)據(jù),大數(shù)據(jù)的基礎是我們數(shù)據(jù)樣本的標準庫是否建立。”國家衛(wèi)生健康委員會規(guī)劃信息司信息處處長沈劍鋒表示,標準的醫(yī)學影像數(shù)據(jù)庫不僅應該對數(shù)據(jù)進行標準化,還應該對病灶有清晰的標注,且兼顧年齡分布、疾病分類等其他維度的信息。
據(jù)介紹,國家衛(wèi)生健康委員會已經(jīng)開始著手進行國家層面的數(shù)據(jù)標準庫的建立。并發(fā)布了《全國醫(yī)院信息化建設標準與規(guī)范》《全國醫(yī)院數(shù)據(jù)上報管理方案》等指導性文件,對包括數(shù)據(jù)在內(nèi)的相關(guān)信息進行標準規(guī)范。
“擁有大數(shù)據(jù)的第三方公司也應該在數(shù)據(jù)規(guī)范方面從事更多的工作?!闭簿S偉說。
美年大健康集團董事長俞熔對此表示認同,他說:“我們的600家運營機構(gòu)去年為兩千多萬人次提供體檢服務,龐大的流量和數(shù)據(jù)理應承載更多的科研和技術(shù)突破的責任。未來將加強相關(guān)標準化數(shù)據(jù)的采集、質(zhì)量控制、數(shù)據(jù)分析工作,以便將數(shù)據(jù)提供給權(quán)威部門,助力建立醫(yī)學影像的專業(yè)數(shù)據(jù)庫?!?/p>
當天,大數(shù)據(jù)算法與分析國家工程試驗室杭州創(chuàng)新中心、浙江省數(shù)理醫(yī)學學會、美年大健康集團三方達成合作,共建超聲大數(shù)據(jù)庫。醫(yī)學影像AI合作開發(fā)聯(lián)盟同步成立,并發(fā)出倡議呼吁各方積極推動資源的高效配置,推動醫(yī)學影像AI技術(shù)落地,通過聯(lián)合研發(fā)共同開展國家級和省市級重大專項、產(chǎn)業(yè)化基金、科技發(fā)展基金等項目的立項、申報和項目的執(zhí)行工作,實現(xiàn)產(chǎn)學研的優(yōu)勢結(jié)合。