北京時間6月8日,斯坦福大學官網(wǎng)發(fā)布了吳恩達團隊的一項最新成果:放射科醫(yī)師借助人工智能算法改進了腦動脈瘤的診斷——腦動脈瘤是大腦血管中的
北京時間6月8日,斯坦福大學官網(wǎng)發(fā)布了吳恩達團隊的一項最新成果:放射科醫(yī)師借助人工智能算法改進了腦動脈瘤的診斷——腦動脈瘤是大腦血管中的隆起物,可能會滲漏或破裂,可能導致中風、腦損傷或死亡。
這項成果發(fā)表在了JAMA Network Open上。斯坦福大學統(tǒng)計學研究生、該論文的聯(lián)合第一作者Allison Park說,“人們對機器學習在醫(yī)學領域的實際作用有很多擔憂。這項研究顯示了人類如何在人工智能工具的幫助下參與診斷過程。”
據(jù)雷鋒網(wǎng)了解,該工具圍繞一種名為HeadXNet的算法構建,可以提高臨床醫(yī)生正確識別動脈瘤的能力,其水平相當于在包含動脈瘤的100次掃描中發(fā)現(xiàn)另外六個動脈瘤,除此之外,它還能提高臨床口譯醫(yī)生的共識。
在腦部掃描中,HeadXNet使用透明的紅色高光指示動脈瘤的位置。(圖片來源:Allison Park)
雖然HeadXNet在這些實驗中取得的成功很有價值,但研究團隊提醒說,需要進一步調(diào)查,以便在實際臨床部署之前評估AI工具的魯棒性,因為不同醫(yī)院擁有不同的設備硬件和成像協(xié)議,研究人員計劃通過多中心合作解決這些問題。
醫(yī)師在AI幫助下降低了漏診率
對腦部掃描結(jié)果進行梳理、尋找動脈瘤意味著要瀏覽數(shù)百幅圖像。動脈瘤有多種大小和形狀,并以不同的角度向外膨脹——有些動脈瘤在一系列類似電影的圖像中不過是一個光點。
“尋找動脈瘤是放射科醫(yī)生最費力、最關鍵的任務之一,”放射學副教授、該論文的聯(lián)合高級作者Kristen Yeom說,“考慮到復雜的神經(jīng)血管解剖結(jié)構所帶來的固有挑戰(zhàn),以及遺漏動脈瘤可能導致的致命后果,這促使我將計算機科學和視覺的進步成果應用于神經(jīng)成像。”
Yeom將這個想法帶到了斯坦福機器學習小組運行的AI for Healthcare Bootcamp,該小組由計算機科學副教授兼該論文的共同高級作者Andrew Ng(吳恩達)領導。小組的核心挑戰(zhàn)是創(chuàng)建一種人工智能工具,可以準確地處理這些大量的3D圖像并補充臨床診斷實踐。
HeadXNet團隊成員從左到右分別是:Andrew Ng,Kristen Yeom,Christopher Chute,Pranav Rajpurkar和Allison Park(圖片來源:LA Cicero)
為了訓練他們的算法,Yeom與Park和計算機科學研究生Christopher Chute合作,收集了611例頭部CT血管造影中檢測到的臨床意義顯著的動脈瘤。
“我們手工標記了每一個體素——相當于一個像素的3D圖像——是否屬于動脈瘤的一部分,”Chute說,“建立訓練數(shù)據(jù)是一項相當艱巨的任務,數(shù)據(jù)量很大。”
經(jīng)過訓練之后,算法確定掃描的每個體素是否存在動脈瘤。
HeadXNet工具的最終結(jié)果是算法的結(jié)論以半透明的高亮顯示在掃描的頂部。這種算法決策的表示形式,使得臨床醫(yī)生在沒有HeadXNet輸入的情況下仍然可以很容易地看到掃描結(jié)果。
“我們感興趣的是,這些帶有人工智能功能的掃描結(jié)果將如何提高臨床醫(yī)生的表現(xiàn),”Pranav Rajpurkar說,他是一名計算機科學研究生,也是該論文的共同主要作者。“我們能夠?qū)用}瘤的確切位置標記給臨床醫(yī)生看,而不僅僅是讓算法說圖像中包含動脈瘤。”
通過評估一組115個動脈瘤的腦部掃描,八名臨床醫(yī)生對HeadXNet進行了測試,一次是在HeadXNet的幫助下進行的,一次沒有。
通過該工具,臨床醫(yī)生正確識別出了更多的動脈瘤,從而降低了“漏診率”,而且醫(yī)生之間更有可能達成一致。此外,HeadXNet并沒有影響臨床醫(yī)生決定診斷所需的時間,也沒有影響醫(yī)生在患者沒有動脈瘤的情況下正確識別掃描的能力。
并不只是人工智能的自動化
雷鋒網(wǎng)了解到,HeadXNet核心的機器學習方法可能會被用來識別大腦內(nèi)外的其他疾病。例如,Yeom設想未來的版本可以專注于加速動脈瘤破裂后的識別,從而在緊急情況下節(jié)省寶貴的時間。但是,將任何人工智能醫(yī)療工具與醫(yī)院放射科的日常臨床工作流程集成起來仍然存在相當大的障礙。
目前的掃描查看器并不是為配合深度學習而設計的,因此研究人員不得不開發(fā)定制的工具,將HeadXNet集成到掃描查看器中。
類似地,真實數(shù)據(jù)的變化——與算法所測試和訓練的數(shù)據(jù)相反——可能會降低模型性能。如果該算法處理來自不同種類設備或成像協(xié)議的數(shù)據(jù),或者處理不屬于其原始訓練的患者群體的數(shù)據(jù),那么它可能不會像預期那樣工作。
吳恩達說:“由于這些問題,我認為部署速度將會加快,不是單純的人工智能自動化,而是人工智能和放射科醫(yī)生的合作。我們?nèi)杂屑夹g和非技術工作要做,但作為一個團隊,我們將達到這一目標,人工智能與放射科醫(yī)生的合作是最有希望的途徑。”