有看到臨床第一線,用AI工具來找出COVID-19患者的,請在文章後面留言。
看到這標題,有沒有一種好像某件事泡沫化的感覺。無論如何,凡走過必留下痕跡,還是有點成果的吧!!
2020年COVID-19爆發以來,全世界都出現AI開發熱,特別是在醫療的領域上,大家都很期待,AI工具可以真的用在臨床上,幫助辨別COVID-19,甚至可以用作預測工具。去年武漢爆發疫情,不少人工智慧(Artificial Intelligence, AI)專家確實期待中國武漢那裡累積的資料,能用來訓練機器學習模型,進而幫助醫師判別COVID-19的患者。目前為止,各位有看到那些AI工具,已經在臨床上用來預測或診斷COVID-19患者,而且是成功的應用嗎?
MIT Technology Review有一篇AI資深編輯的文章,討論到這個主題,該篇文章根據一些研究文獻,包含 The Turing Institute 和Review in the British Medical Journal ,指出,現在即使有AI工具能在臨床上應用,很可能都是沒有經過適當測試的。然而,確也不可否認,這場忙翻全世界的COVID-19疫情,確實助攻AI的發展。
面對疫情的處理,大多數的AI工具開發者,就是希望可以用AI演算出來的數據,幫忙提供診斷數據、分流病人。這一年多來,上百個AI工具(或者更多)因而出現,但上述研究指出,沒有一個AI工具能真的看到受測者有無COVID-19的差異,甚至有些結論還造成傷害。為什麼呢?聽起來很嚴重。下面幾點是文章中提到可能的原因:
這些AI工具不適合在臨床使用
一篇在Nature Machine Intelligence發表的文章,針對深度學習和醫學影像的應用的主題,例如用胸部X光和電腦斷層掃描的影像,來診斷和預測COVID-19,審閱了415個已經發表的AI工具,結論是沒有一個適合在臨床使用。而British Medical Journal和Nature Machine Intelligence的文章都指出,這些AI工具的研究員或開發者,一直重複基本的錯誤,這個錯誤就是在訓練和測試AI工具的方法。怎麼說呢?這裡指得是對訓練這些AI工具的資料,做不正確的假設。也就是說,這些訓練過的模型不會如同它宣稱的功能來運作。讓科學家非常擔心,即使大家對AI仍然充滿期待,但如果演算法和用來訓練模型的資料不正確,很有可能誤診或者低估了風險。
怎麼辦?問題在哪?
聽起來很嚴重?其實資料不夠實在,品質不佳應該是根本問題。現有的COVID-19資料,大概是這場疫情發展到中期的時候累積出來的。醫生不知道要怎麼治療病患的時候。研究人員想幫忙,也只有這些資料可用。意思是說很多AI工具是建立在這些被認為”急就章”、”不完全正確”的資料上。
例如:用了很多沒有得到COVID-19的兒童胸部X光影向,作為成人沒有COVID-19確診的影像資料。這樣只是讓AI學會如何去辨識小孩,而非COVID-19。又例如說,混用到受測者躺下和站立時的影像,甚至有一些是抓到X光上用來標示病人資料的註釋。另外,問題也在於當初這些影像是否有COVID是怎麼定義的?是有對患者做PCR檢測,還是臨床的人看影像覺得有確診,就定義了這些影像資料呢?
其實也不會太糟啦!聽起來這些錯誤都是可以避免的。只是以上也突顯,要建立可以用來診斷COVID-19的AI影像工具,那麼這群開發者,必須要對醫學影像有所了解,也要真的了解AI的演算模型,來開發這樣的工具。
如何解決問題?
當然是要有合適的、正確的資料。
最簡單的方法,就是需要研究開發者和臨床人員之間,保持良好的溝通,彼此知道AI模型如何使用,如何訓練AI模型。此外,就是資料格式,需要標準化。
以上,其實也告訴我們,一件外界看來很簡單,就不過是臨床資料分享給開發者,這之間就有它的難度。學術研究是否會不太願意分享資料,還是臨床資料有隱私的顧慮呢!你也在開發AI工具嗎?要用在臨床診斷COVID-19患者嗎?先好好檢視自己用來訓練這個模型的資料,會避免掉很多錯誤喔!
參考文章: MIT Technology Review