人工智能戰(zhàn)勝42名醫(yī)療專(zhuān)家 專(zhuān)家將面臨失業(yè)?
人工智能在專(zhuān)業(yè)醫(yī)學(xué)領(lǐng)域全面戰(zhàn)勝人類(lèi)醫(yī)生的例子還很少見(jiàn)。最近一項(xiàng)深層神經(jīng)網(wǎng)絡(luò)算法在診斷灰指甲方面,成功擊敗了42位皮膚科專(zhuān)家?;抑讣资且环N常見(jiàn)的真菌感染,它會(huì)讓指甲脫色和脆化,這種疾病每年困擾著大約3500萬(wàn)美國(guó)人。
這項(xiàng)成功很大程度依賴于一個(gè)韓國(guó)研究團(tuán)隊(duì)的努力,他們收集了大約5萬(wàn)張指甲/趾甲的圖片。大量的訓(xùn)練數(shù)據(jù),是深層神經(jīng)網(wǎng)絡(luò)成功識(shí)別灰指甲,戰(zhàn)勝人類(lèi)醫(yī)學(xué)專(zhuān)家的關(guān)鍵所在。
韓國(guó)首爾的皮膚科醫(yī)生、臨床醫(yī)生Seung Seog Han表示,“迄今為止,在很多研究——比如識(shí)別糖網(wǎng)、皮膚癌和閱讀胸片等項(xiàng)目中,人工智能已經(jīng)接近了人類(lèi)專(zhuān)家的水平。但這項(xiàng)研究首次表明,人工智能已經(jīng)超越了人類(lèi)專(zhuān)家。”
過(guò)去人工智能和皮膚科醫(yī)生之間的較量通常勢(shì)均力敵。但在這項(xiàng)研究中,在一個(gè)特定場(chǎng)景下的三次實(shí)驗(yàn)里,只有一名皮膚科醫(yī)生的表現(xiàn)全部略優(yōu)于深度神經(jīng)網(wǎng)絡(luò)。而且,值得注意的是,對(duì)于簡(jiǎn)單病例,深層神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)更加明顯。
這項(xiàng)研究成果發(fā)表在了2018年1月19日的PLOS ONE 雜志網(wǎng)絡(luò)版上。參與這項(xiàng)研究的除了Seung Seog Han,還有韓國(guó)翰林大學(xué)的皮膚病學(xué)教授 Gyeong Hun Park,以及韓國(guó)蔚山大學(xué)的皮膚病學(xué)教授 Sung Eun Chang。
作為一名醫(yī)生,Han在日常工作中接觸到了各種各樣的皮膚病。同時(shí),他也學(xué)習(xí)了不少計(jì)算機(jī)編程語(yǔ)言方面的知識(shí),比如C++和Python。后來(lái),AlphaGo擊敗世界圍棋冠軍李世乭,又激發(fā)了Han探索深度學(xué)習(xí)的興趣。
人類(lèi)往往難以把握大數(shù)據(jù)的規(guī)律,但深度學(xué)習(xí)算法在大數(shù)據(jù)的模式檢測(cè)方面有著獨(dú)到的優(yōu)勢(shì)。在這個(gè)案例中,韓國(guó)的研究人員發(fā)現(xiàn)可以用微軟研究院開(kāi)發(fā)的深度學(xué)習(xí)算法幫助醫(yī)生從數(shù)字照片中識(shí)別可能的灰指甲感染病例。
但任何深度學(xué)習(xí)模型都需要基于大量的數(shù)據(jù)進(jìn)行訓(xùn)練。收集灰指甲病例的圖片給研究人員提出了巨大的挑戰(zhàn),因?yàn)檫@些圖片通常沒(méi)有標(biāo)準(zhǔn)和統(tǒng)一的格式。很多圖片是從不同角度拍攝的,里面既有健康的指甲/趾甲,也有受到感染的指甲趾甲。此外,受深度學(xué)習(xí)算法的技術(shù)限制,所有圖像都要調(diào)整到224 x 224像素大小,這樣一來(lái)很多圖片就無(wú)法識(shí)別了。
韓和他的同事們訓(xùn)練了一種名為Faster R-CNN的目標(biāo)檢測(cè)算法,對(duì)圖像進(jìn)行識(shí)別和裁剪,使圖片中只包含受感染的指甲/趾甲,然后再將圖片放大,這樣就得到了一個(gè)可以用于訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)集。數(shù)據(jù)集中的大部分圖片都來(lái)自于一個(gè)Han 在 2007 年開(kāi)發(fā)的、名為MedicalPhoto的皮膚病臨床照片管理程序。
即便如此,Han還是要手動(dòng)讀取Faster R-CNN裁剪出來(lái)的10萬(wàn)張照片,并對(duì)每張照片進(jìn)行兩次標(biāo)記,將不準(zhǔn)確或不合適的指甲/趾甲照片剔除,以保證訓(xùn)練數(shù)據(jù)的準(zhǔn)確性。即使Han平均每10秒鐘能處理一張照片,且每天工作數(shù)小時(shí),這項(xiàng)工作也需要耗費(fèi)他大約550個(gè)小時(shí),合計(jì)超過(guò)70天。
該數(shù)據(jù)集幫助訓(xùn)練了用于識(shí)別病癥的卷積神經(jīng)網(wǎng)絡(luò)——微軟的 ResNet-152 和牛津大學(xué)的 VGG-19 模型,以執(zhí)行識(shí)別指甲真菌感染可能病例的工作。這種深度學(xué)習(xí)方法表現(xiàn)優(yōu)于 42 位皮膚科專(zhuān)家組成的小組——其中包括 16 名教授、18 名臨床醫(yī)生和 8 名住院醫(yī)師。
研究人員表示,在額外的測(cè)試中,深度學(xué)習(xí)算法的表現(xiàn)也通常優(yōu)于5名最好的皮膚科醫(yī)生。他們還發(fā)現(xiàn),人工智能的診斷評(píng)估也比一般內(nèi)科醫(yī)生、醫(yī)學(xué)生、護(hù)士和非醫(yī)務(wù)人員的診斷結(jié)果要好。
該研究團(tuán)隊(duì)發(fā)布了他們深度學(xué)習(xí)算法的早期演示版本,任何人都可以通過(guò)網(wǎng)站或下載Android智能手機(jī)應(yīng)用程序進(jìn)行嘗試。通過(guò)在網(wǎng)站和應(yīng)用程序中收集數(shù)據(jù),研究人員希望發(fā)現(xiàn)該人工智能算法在實(shí)際醫(yī)療實(shí)踐中使用時(shí)可能會(huì)出現(xiàn)哪些問(wèn)題。
Han和他的同事們也在嘗試用深度學(xué)習(xí)診斷皮膚癌等其他皮膚疾病。相關(guān)的研究論文發(fā)表在了2018年2月8日的《Journal of InvesTIgaTIve Dermatology》網(wǎng)絡(luò)版上。
這類(lèi)研究表明,人工智能依賴于臨床影像來(lái)診斷疾病,因此在遠(yuǎn)程醫(yī)療領(lǐng)域更有用武之地。人類(lèi)皮膚科醫(yī)生在做診斷時(shí)還是要結(jié)合病人的病史和其他臨床信息,因?yàn)閷?duì)于大多數(shù)人來(lái)說(shuō),僅憑影像就下診斷還是顯得太過(guò)草率了。
Han和他的同事們認(rèn)為,他們的研究對(duì)于全科醫(yī)生尤其有用,因?yàn)椴∪藗兘?jīng)常會(huì)向全科醫(yī)生反饋?zhàn)约旱闹讣缀推つw問(wèn)題。Han說(shuō)道:“人工智能的診斷要比普通臨床診斷更為準(zhǔn)確,我認(rèn)為它對(duì)全科醫(yī)生確定灰指甲的治療方向有所幫助。”