IBM大力炒作Watson機(jī)器學(xué)習(xí)系統(tǒng),未來的道路卻充滿荊棘
掃描二維碼
隨時隨地手機(jī)看文章
IBM,位列最聰明的50家公司榜單的中第39名,雖然對自家的Watson機(jī)器學(xué)習(xí)系統(tǒng)有些夸大,但這家公司的確能接觸到可將藥品信息變?yōu)楹唵斡杏玫臄?shù)據(jù)。
保羅·唐正待在醫(yī)院里陪伴剛完成關(guān)節(jié)置換手術(shù)之后的妻子。每年,在美國約有70萬人接受關(guān)節(jié)置換手術(shù)。唐本人是一名初級保健醫(yī)師,外科醫(yī)生走過來,唐問醫(yī)生根據(jù)自身經(jīng)驗(yàn)估計,依照他妻子的情況,大概需要多久能回歸正常的生活。醫(yī)生一直給出的都是支支吾吾的答復(fù)。“我最后明白了”唐說。“醫(yī)生他自己也不知道”。唐很快意識到大多數(shù)的醫(yī)生不知道病人回到家庭、工作后的生活方式,而生活方式對病人來講,至關(guān)重要。
唐不僅是病人眼中的醫(yī)生,還是IBM的Watson健康的首席康復(fù)執(zhí)行官。IBM差不多把自己的未來都押寶在Watson機(jī)器學(xué)習(xí)系統(tǒng)上了,而Watson健康是為Watson開發(fā)醫(yī)療保健應(yīng)用程序的商業(yè)團(tuán)隊(duì)。Watson能傳遞醫(yī)生無法實(shí)時獲取的信息。舉個例子,它能告訴醫(yī)生,類似于唐的妻子的情況,需要多久才能無痛的行走、上下樓梯。他甚至可以幫助分析圖像和組織樣本,為指定的病患確定最佳的治療方案。
出于這種可能,醫(yī)療保健是機(jī)器學(xué)習(xí)技術(shù)市場中最熱門的領(lǐng)域之一。根據(jù)研究機(jī)構(gòu)CB Insights統(tǒng)計,至少有106家2013年起步的創(chuàng)業(yè)公司至今仍在運(yùn)營。
多虧了Watson在益智問答節(jié)目危險邊緣中的成功,其他公司都沒有涉及Watson所關(guān)注的地方。IBM自2011年及之后的市場營銷工作一直做的不錯,但之后都是關(guān)于Watson的負(fù)面消息。IBM極力促成的與M.D.Anderson癌癥中心的合作與今年告吹。隨著IBM的收入下滑,股價起伏不定,分析人士質(zhì)疑Watson能否提供真正的價值。創(chuàng)建風(fēng)投公司,較有影響力的科技投資者Chamath Palihapitiya五月份在CNBC上聲稱:“Watson就是個笑話”。
然而,對于Watson的大多數(shù)批評,甚至是來自M.D.Anderson方面的批評,似乎不是針對任何技術(shù)上的缺陷,而是針對IBM對于Watson未來將達(dá)到的地步過于樂觀。事實(shí)上,在將AI應(yīng)用到醫(yī)療衛(wèi)生問題方面,似乎仍是Watson健康處于龍頭地位。如果Watson至今還沒有實(shí)現(xiàn)之前提到的諸多功能,一個重要的原因是,它需要特定類型的數(shù)據(jù)去訓(xùn)練自己。在很多情況下,這種數(shù)據(jù)供給緊俏或者難以觸及。但這個問題不是僅僅針對Watson,整個醫(yī)療健康領(lǐng)域的機(jī)器學(xué)習(xí)都是處于進(jìn)退兩難的處境。
丟失和無法接觸數(shù)據(jù)可能會讓W(xué)atson的緩腳步,還可能給對IBM的競爭者帶來更沉重的打擊。獲取數(shù)據(jù)的最佳選擇在于跟大型醫(yī)療衛(wèi)生機(jī)構(gòu)保持良好的關(guān)系,而這些機(jī)構(gòu)在技術(shù)上傾向于保守態(tài)度。相對于創(chuàng)業(yè)公司亦或是巨頭Apple、Google,IBM在取得大型機(jī)構(gòu)的高管、IT經(jīng)理的信任方面做的尤為出色。盡管M.D.Anderson項(xiàng)目存在問題,IBM自身仍具備重要優(yōu)勢。這些優(yōu)勢使得Watson能進(jìn)入各種各樣的醫(yī)療中心、醫(yī)療衛(wèi)生管理集團(tuán)和生命科學(xué)公司。所有的這些機(jī)構(gòu)能夠提供塑造AI在醫(yī)藥領(lǐng)域未來的重要數(shù)據(jù)。
不現(xiàn)實(shí)的時間表
和M.D.Anderson的分道揚(yáng)鑣似乎意味著IBM在炒作Watson方面搬起石頭砸了自己的腳。
癌癥中心于2012年與IBM合作。目的是為了讀取關(guān)于病人特征、基因序列和病理報告的數(shù)據(jù),結(jié)合數(shù)據(jù)與醫(yī)生對病人的醫(yī)囑、相關(guān)的日志記錄,為醫(yī)生提供診斷和治療。但是IBM和M.D.Anderson對于技術(shù)都抱有過高的期望。IBM在2013年聲稱“計算的新紀(jì)元到了”,給Forbes一種Watson“進(jìn)入臨床試驗(yàn)”的印象,在幾個月后就能用于病患。在2015年,華盛頓郵報引用一位IBM Watson主管的關(guān)于Watson如何忙于建立“人機(jī)之間的集合智慧模型”的描述。郵報稱電腦系統(tǒng)“正在與醫(yī)生一同訓(xùn)練,完成醫(yī)生無法勝任的工作”。
“醫(yī)療衛(wèi)生在采用新技術(shù)方面一直處于尷尬的遲滯狀態(tài)”Cleveland診所醫(yī)生、醫(yī)療衛(wèi)生信息專家Manish Kohli如此說到。
在今年2月份,運(yùn)營M.D.Anderson項(xiàng)目的德克薩斯大學(xué)宣布關(guān)閉該項(xiàng)目,使得醫(yī)療中心跟IBM欠款3900萬美元,而項(xiàng)目的原始合同額為240萬美元。四年之后,項(xiàng)目并未做出符合初步測試能用于病人的系統(tǒng)。M.D.Anderson沒有對Watson做具體的評論,但問題似乎出現(xiàn)在內(nèi)部關(guān)于項(xiàng)目如何管理和資助方面。
那樣并不意味著IBM與Watson之間沒有問題。實(shí)際上,二者間的問題比IBM面臨的其他問題要大許多。
要了解什么拖慢了進(jìn)度,你必須清楚像Watson這樣的機(jī)器學(xué)習(xí)系統(tǒng)是如何被訓(xùn)練的。Watson通過不斷重新調(diào)整它的內(nèi)部處理流程來得到一些問題集合的最高可能性的正確答案,比如哪張放射性圖片顯示癌癥。正確答案必須是已知的,這樣系統(tǒng)才能被告知它何時做對,何時做錯。系統(tǒng)能吞吐的問題量越大,得到結(jié)果的準(zhǔn)確率就越高。
當(dāng)訓(xùn)練系統(tǒng)識別X射線圖像中的惡性腫瘤時就相對簡單。但對于潛在的新問題已經(jīng)遠(yuǎn)超人類所涉及的范圍,比如檢測基因變量和疾病之間的關(guān)系。Watson存在一個雞生蛋還是蛋生雞的問題:沒有經(jīng)過專家篩選和合理整理的數(shù)據(jù)如何能用來訓(xùn)練系統(tǒng)?紐約Memorial Sloan-Kettering癌癥中心的計算病理學(xué)家Thomas Fuchs稱,如果你在教一輛自動駕駛汽車,任何人都可以標(biāo)記一棵樹或一個標(biāo)識,系統(tǒng)才能學(xué)會識別標(biāo)記。“但在醫(yī)藥的特殊領(lǐng)域,你可能需要經(jīng)過數(shù)十載訓(xùn)練的專家來標(biāo)記用來訓(xùn)練系統(tǒng)的數(shù)據(jù)”。
在IBM希望Watson發(fā)力的每個領(lǐng)域都會出現(xiàn)形形色色的絆腳石,任何其他公司的機(jī)器學(xué)習(xí)解決方案都會遇到相同的情況。為了鍛煉Watson去仔細(xì)檢查數(shù)據(jù)庫并提取針對單個病人的幾條信息,必須要有人提前手工整理成百上千條的病例。為了識別與疾病相關(guān)的基因,Watson需要成千上萬條有具體疾病且DNA已經(jīng)被分析的患者記錄。但這種患者及其基因記錄的組合數(shù)據(jù)是很難得到的。在很多情況下,數(shù)據(jù)并非按照正確的格式存在,或者按照任何格式存在。數(shù)據(jù)也可能分散在諸多不同的系統(tǒng)中,難以處理。
舉個例子,把更好的數(shù)據(jù)放在臨床醫(yī)師的面前來達(dá)到改善初級衛(wèi)生保健的目的。當(dāng)醫(yī)生沒能在常規(guī)的初級保健訪問中治理一些相對較小的健康隱患,這些健康隱患可能會惡化而將病人送進(jìn)急救室或者專家那里,病人的健康將受損而且開銷劇增。IBM Watson健康的首席醫(yī)療官,同時也是一位執(zhí)業(yè)的初級保健護(hù)理醫(yī)師稱,在健康方面花的錢有三分之一可能都是不必要的。機(jī)器學(xué)習(xí)被普遍認(rèn)為是解決這一問題的機(jī)會。為了真正幫助醫(yī)生為患者帶來更好的效果,Watson將需要找出它在健康記錄中讀取的內(nèi)容與唐口中所謂的“健康的所有社會決定因素”之間的關(guān)聯(lián)。這些因素包括患者是否吸毒,避免錯誤的食品,呼吸新鮮的空氣等等。但唐承認(rèn)幾乎沒有醫(yī)院或醫(yī)療機(jī)構(gòu)能獲取相當(dāng)比例患者的可靠數(shù)據(jù)。部分原因是醫(yī)院在采取現(xiàn)代化、數(shù)據(jù)驅(qū)動的實(shí)踐方面較為遲緩。“醫(yī)療衛(wèi)生在采用新技術(shù)方面一直處于尷尬的遲滯狀態(tài)”Cleveland診所醫(yī)生、醫(yī)療衛(wèi)生信息專家Manish Kohli如此說到。
哪里有數(shù)據(jù),IBM通常就是簡單地過去把它買下來。IBM收購了Truven Health Analytics、Explorys和Phytel等公司。所有的這些公司在處理跨醫(yī)院與病患人群的大宗數(shù)據(jù)集上都表現(xiàn)活躍。即使在解散M.D.Anderson項(xiàng)目合約之后,IBM仍有一些重要的伙伴關(guān)系使得其未來能接觸到患者數(shù)據(jù)。
他們中的一家機(jī)構(gòu)便是Atrius Health。Atrius Health是一個由波士頓地區(qū)近900位主要是初級保健醫(yī)師組成的網(wǎng)絡(luò)?;锇殛P(guān)系的目的是開發(fā)和測試一個基于Watson的系統(tǒng),系統(tǒng)將具備從海量筆記、記錄和文獻(xiàn)中提取出對單個病患至關(guān)重要的信息。Atrius的首席醫(yī)療官Joe Kimura說:“尋求所有相關(guān)信息對于初級保健醫(yī)生來說是一件艱巨的任務(wù)。電子化醫(yī)療記錄可能會讓問題更加糟糕,他補(bǔ)充道。因?yàn)檫@些系統(tǒng)會大大增加每次訪問中產(chǎn)生的數(shù)據(jù)量而且沒有提供用于方便檢索的標(biāo)準(zhǔn)格式。
重要的是,患者記錄中大多數(shù)筆記是常規(guī)IT系統(tǒng)無法理解的句子。為了提取句子的含義,Watson可以使用為危險邊緣而開發(fā)的自然語言處理技術(shù)。理想情況下,它可以為醫(yī)師提供建議幫助病人避免額外的護(hù)理。“為什么我們應(yīng)該只關(guān)注確保做好髖骨骨折的病人的護(hù)理工作?”Kimura問到,“我們何時能預(yù)測哪位病人有摔倒的風(fēng)險并幫助他們避免摔壞髖骨?我們要向上推進(jìn)護(hù)理工作”。
2013年,M.D.Anderson的一位白血病醫(yī)生在咨詢病人時,使用IBM的Watson系統(tǒng)
IBM在2015年宣布Watson的診斷能力將因由Merge Healthcare獲取的數(shù)據(jù)而得到進(jìn)一步提升。Merge Healthcare是IBM花費(fèi)10億美元收購的醫(yī)療圖像管理公司。
Watson健康一直與紐約護(hù)理協(xié)調(diào)中心合作。該中心是由政府資助的機(jī)構(gòu),與六個縣的約2000個保健服務(wù)機(jī)構(gòu)合作?;锇殛P(guān)系旨在達(dá)成急診室入院和出院病人因相關(guān)問題再次入院的數(shù)量減少25%的目標(biāo)。它還隱含的提供了接觸大量病患數(shù)據(jù)的途徑。
接觸此類數(shù)據(jù)有很多途徑。Google的姐妹公司之一正在試圖直接從患者身上獲取數(shù)據(jù)。Verily生命科學(xué),Alphabet的一個健康護(hù)理部門,正與杜克大學(xué)、斯坦福大學(xué)合作開發(fā)基于約10000名志愿者的高度結(jié)構(gòu)化的健康數(shù)據(jù)庫。數(shù)據(jù)庫中數(shù)據(jù)不僅來自他們的日常就診,還來自可穿戴的健康監(jiān)測設(shè)備。盡管可能要花費(fèi)10年甚至更久才能獲取高度可用的結(jié)果,這在獲取數(shù)據(jù)方面依然是令人為之振奮的一次飛躍。
Sloan-Kettering紀(jì)念癌癥中心的Fuchs的團(tuán)隊(duì)希望訓(xùn)練一個人工智能系統(tǒng)去讀取組織染色的幻燈片。這一過程將需要大量已經(jīng)確診并用數(shù)字化標(biāo)記的幻燈片和其他重要的數(shù)據(jù)。所以這個團(tuán)隊(duì)正準(zhǔn)備獨(dú)自生產(chǎn)40000張幻燈片。“那可比其他家的數(shù)據(jù)多了去了”Fuchs稱。“因?yàn)樯飳W(xué)中的所有變量,這將是一個浩瀚的工程”。
即便棄Watson項(xiàng)目的命運(yùn)不顧,M.D.Anderson一直在進(jìn)行一項(xiàng)大的項(xiàng)目。這個項(xiàng)目大概跟Watson項(xiàng)目同時起步,專注于收集自家中心每位病人1700種類型的臨床數(shù)據(jù)。運(yùn)營該項(xiàng)目的科學(xué)家Andy Futreal稱,把研究數(shù)據(jù)與病患信息結(jié)合將對系統(tǒng)希望Watson具備的各種能力至關(guān)重要。Futreal表示,“一旦掌握了數(shù)據(jù),我們便可以進(jìn)入人工智能機(jī)器學(xué)習(xí)的業(yè)務(wù),該業(yè)務(wù)將揭示哪些治療有效,哪些無效”。
IBM持續(xù)從合作伙伴那里積累數(shù)據(jù)。盡在癌癥診斷和護(hù)理方面,公司就和Memorial Sloan-Kettering、Mayo診所、哈佛和麻省理工附屬的Broad Institute以及醫(yī)療測試巨頭Quest Diagnostics。Sloan-Kettering紀(jì)念癌癥中心已經(jīng)制作了一個通過篩查期刊文獻(xiàn)來確定治療方案的系統(tǒng)。該系統(tǒng)已經(jīng)在弗羅里達(dá)的木星醫(yī)療中心和印度的醫(yī)療連鎖店進(jìn)行了推廣。在研發(fā)藥物方面,Watson健康和巴羅神經(jīng)研究所合作發(fā)現(xiàn)了與ALS疾病從未聯(lián)系到一起過的5個關(guān)聯(lián)基因,和安大略省大腦研究所合作確認(rèn)21種可能的替代藥物。
Watson在改善健康結(jié)果、降低開銷方面會有所作為嗎?可能吧,專注健康護(hù)理、投資人工智能健康護(hù)理方面的創(chuàng)業(yè)公司的風(fēng)投公司Bessemer Venture Partners的合伙人Stephen Kraus這樣評價到。“IBM一直是真刀實(shí)槍的在做”,Kraus稱。“這不是像哄抬股價那樣放出煙霧彈”。但Kraus和其他專家一樣懷疑不切實(shí)際的時間表和承諾,其中的一些質(zhì)疑聲來自IBM自身。“這實(shí)現(xiàn)起來很困難”他說到。“Watson今天不會實(shí)現(xiàn),可能5年之后也不會實(shí)現(xiàn),而且它不會取代醫(yī)生”。