IBM的AI醫療走進死胡同:想用NLP解決醫學問題,連Bengio也不看好
2019年04月15日15:07

從2011年開始,藍色巨人IBM在AI醫療上押上了重注,甚至為其AI部門建立了一個華麗的總部。這一切都是為了在AI浪潮中保持自己的領先定位。

然而IBM Watson的醫療技術已經使用了8年,卻從未給人留下深刻印象。

IEEE Spectrum高級副主編Eliza Strick認為IBM Watson醫療雷聲大雨點小,前期給了很高承諾,如今卻遠遠沒有達成目標。

在IBM的設想中,Watson的記憶庫掌握著各種罕見疾病的知識,可以在幾秒內就解決一個棘手的病例。如果Watson能夠將這種即時專業知識帶到世界各地的醫院和診所,人工智能似乎可以減少診斷錯誤。

但是Watson的成果只限於研究領域。IBM試圖將Watson應用於醫學界的最大挑戰之一癌症時,遇到了機器學習方式和醫生工作方式之間的根本不匹配。

8年承諾未能兌現

2011年,IBM Watson在智力競賽電視節目《危險邊緣》中戰勝兩位人類冠軍,隨後IBM宣佈了自己雄心勃勃的計劃:未來讓Watson成為一名AI醫生。IBM還承諾在未來18到24個月的時間里推出首批醫療健康產品。

實際上,IBM當時宣佈的項目並沒有產生任何商業產品。

此後8年中,IBM高調宣揚自己在AI醫療技術上的努力,但是與其他醫院、高校合作的AI醫療項目大多數已經失敗。

據IEEE Spectrum統計,從2011年開始,IBM Watson與其他機構合作的25個具有代表性的項目中,僅有5個合作項目推出了AI醫療產品。

IBM還試圖通過收購來加強自身,但內部人士表示,收購的公司並沒有起太大的作用。

從IBM的Watson Health部門出來的產品與曾經設想的AI醫生完全不同:它更像是可以執行某些日常任務的AI助手。

加州大學舊金山分校醫學系主任Robert Wachter說:IBM遇到了麻煩。他們把營銷放在第一位,產品放在第二位,吊足了人們的胃口,但是項目上馬後,又發現這是一個非常難解決的問題。

NLP短期解決不了問題

目前,美國監管機構只批準了少數AI工具用於醫院。這些開創性的產品主要是在視覺領域,而IBM卻一直致力於用NLP解決醫療問題。

其他AI醫療公司在研究用計算機視覺分析圖像,如X光片和視網膜掃瞄。但是IBM沒有這樣分析醫學影像的產品,儘管他們在該領域有一個活躍的研究項目。

除去醫療影像,即便是今天最好的AI也難以理解複雜的醫療信息。用軟件對人類醫生專業知識進行編碼是一件非常困難的事情。正如全世界所看到的,IBM已經在市場上學到了這些痛苦的教訓。

雖然IBM並沒有放棄目標,但它的失敗已經向技術專家和醫生們表明,創建AI醫生是多麼困難。

2011年Watson在知識問答上的勝利,證明了它在NLP方面的卓越表現。為了玩這個遊戲,它必須解析複雜的文字遊戲線索,搜索大量的文本數據庫,找到並確定最好的答案。

“看起來Watson幾乎可以理解語言的含義,而不僅僅是識別單詞的模式。” 在2011年曾擔任IBM 研究院首席醫學科學家Martin Kohn說。

其實早在參加《危險邊緣》之前,IBM就已經考慮過AI醫療的可能性。

大量的患者數據看起來非常適合用於AI醫療研究,特別是當醫院和醫生開始使用電子健康記錄時。

雖然其中一些數據可以很容易地被機器消化,例如實驗室結果和生命體徵測量數據,但還有大部分是“非結構化”信息,例如醫生筆記和出院記錄。這類敘述性文本占到患者記錄約80%的內容。

Kohn認為,Watson強大的NLP能力可以轉變為醫學理論。Watson可以閱讀患者的健康記錄以及醫學文獻的全部內容,包括教科書、同行評審期刊文章、批準藥物清單等。通過訪問所有這些數據,Watson可能會成為一名超級醫生,能夠辨別出人類無法看到的模式。

哥倫比亞大學醫學系教授Herbert Chase曾與IBM展開合作,希望Watson能成為一種“臨床診斷支持”工具,他們一起研究了一種診斷工具的原型。但是雙方從2014年分道揚鑣,原因是Chase教授對Watson進展緩慢感到失望。

Chase教授只是IBM Watson的眾多合作者之一,另一名合作者馬里蘭大學放射學教授認為,AI工具在10年內對醫生來說是不可或缺的,但他並不相信IBM能實現它們。

他說:“我不認為IBM處於AI技術的最前沿,最令人興奮的事情發生在蘋果、Google、亞馬遜這些公司。”

2014年,Kohn離開了IBM,他說:“僅僅證明你擁有強大的技術是不夠的,還需要向別人證明你能做出有用的東西。”

Kohn一直在等待醫學期刊上的論文證明AI可以改善患者的治療效果並節省醫療系統的花費。到目前為止,這類文章發表的很少,Watson也沒有任何結果。

IBM首次涉足AI醫療領域

在試圖將AI引入醫療時,IBM面臨著巨大的挑戰,它在許多計算領域已經落後於Google、蘋果等巨頭。IBM需要一些重要的東西才能保證地位。為此,IBM在AI醫療領域投入大量資金。

2014年,IBM向Watson部門投資10億美元。2015年,IBM宣佈成立一個特殊的Watson Health部門,到2016年中期,Watson Health已經收購了四家健康數據公司,總花費約40億美元。

IBM似乎有了讓AI進入醫療健康領域所需的技術、資源和承諾。“將AI用於醫療健康是一項艱巨的任務,這是一項挑戰,但我們正在這樣做。” IBM認知解決方案和IBM研究院高級副總裁John E. Kelly說。從2011年開始,Kelly就負責指導Watson研究,現在他還負責對Watson Health的直接監督。

他說公司在需要的時候已經轉向:“我們正在繼續學習,所以我們的產品會隨著我們的學習而改變。”

IBM的醫療診斷工具就是一個例子,它並沒有上市,IBM醫療保健和生命科學研究副總裁Ajay Royyuru說:“診斷不是我們要進入的領域,這是醫療專家們可以做得很好的地方,無論你用AI做得多好,都不會取代人類專家。”

為了找到AI醫療的商業案例,IBM開展了一系列令人眼花繚亂的項目,針對醫療保健系統中不同參與者:醫生、行政人員、保險公司和患者。

在許多種嚐試中,IBM努力讓Watson的NLP去理解醫療文本。但蒙特利爾大學計算機教授Yoshua Bengio說,在醫學文本文件中,人工智能系統無法理解其模糊性,也無法瞭解人類醫生注意到的微妙線索。到目前為止,沒有人工智能可以達到人類醫生的理解和洞察力。

IBM對癌症的研究是這家公司遇到的主要挑戰之一。一位肺癌專家Mark Kris表示:“我認為沒有人會知道這(實現癌症診斷)會花多長時間。”他所在的研究機構早在2012年就和IBM Watson展開了合作。

Kris和其他醫生在2015年訓練了一個人工智能系統,該系統成為了Watson腫瘤產品。德克薩斯大學MD安德森癌症中心的醫生與IBM合作創建了一個名為Watson腫瘤顧問。白血病部門測試了該工具,但它從未成為商業產品。

Watson腫瘤顧問遭受了多方批評。有文章指出Watson腫瘤是無用甚至會提供危險的建議。Kris說他經常聽到批評說該產品不是“真正的人工智能”。IBM與MD安德森癌症中心的合作項目花費了6200萬美元,最後以失敗告終而被取消。

該項目揭示了機器學習的承諾與醫療保健的現實根本不匹配,在“真正的AI”與當今醫生對功能性產品的要求之間存在著差距。

Watson腫瘤通過獲取大量癌症患者健康記錄和醫學文獻來學習。IBM希望Watson憑藉其強大的計算能力,將檢查這些記錄中的數百個變量,發現人類無法看到的模式。對於腫瘤學家來說,這聽起來像癌症護理方面的潛在突破。對於IBM來說,它聽起來就像一個偉大的產品。

Watson很快就學會了如何瀏覽臨床研究的文章並確定基本結果。但它不會像醫生那樣閱讀文章。醫生是從文章中提取信息,用來改變他們的治療方法。

而Watson的思想是基於統計數據,所以它能做的就是收集有關主要結果的統計數據。“但醫生不這樣做。”

例如,在2018年,FDA批準了一種新癌症藥物,它對所有表現出特定基因突變的腫瘤都有效。人類醫生會建議每個肺癌患者都接受這種基因檢測,但Watson不會根據有55名患者中4名肺癌患者改變結論。

與現有醫療體系標準不符

Watson無法從醫療文獻中新的病曆事件提取出自己的見解,這隻是它失敗的第一步。研究人員還發現,它也無法像預期的那樣從患者的電子健康記錄中挖掘信息。

研究人員讓Watson研究白血病患者的健康記錄。在一份2018年發表於The Oncologist的論文中,該團隊報告說,基於Watson的腫瘤學專家顧問在從醫療記錄中的文本文檔中提取信息方面取得了不同程度的成功。在處理診斷等明確概念時,準確度從90%到96%不等,但對依賴於時間的信息(如治療時間線),準確度僅為63%至65%。

不僅如此,IBM實現AI超級醫生的夢想還遭遇了另一重打擊:研究人員意識到,Watson無法將新患者與之前發現隱藏模式的癌症患者進行比較。IBM本來希望AI能夠模仿他們的專家腫瘤學家的能力,利用之前的結果和經驗,為新患者製定治療策略。

但醫療保健系統目前的標準並不鼓勵這種現實世界的學習。AI系統的建議基於它在醫療記錄中發現的模式 ,但是如果沒有科學研究的嚴格控製,這種發現只會被認為是相關性,而不是因果關係。

IBM認為醫療保健的標準必須改變,才能讓AI實現其全部潛力並轉化為醫學。

腫瘤專家不信任

根據傳聞報導,IBM在美國尋找其Watson腫瘤產品的買家時遇到了麻煩。一些腫瘤學家說他們相信自己的判斷,並不需要沃森告訴他們該做什麼。有人說Watson只是建議他們很清楚的標準治療方法。

在過去的幾年里,與IBM合作的醫院已開始發表關於Watson腫瘤相關經驗的研究。

在印度,Manipal綜合癌症中心的醫生對638例乳腺癌病例中,Watson與專家治療建議的一致率為73%。Watson在韓國Gachon大學Gil醫療中心表現更差,該醫院為656名結腸癌患者提供的最佳建議,只有49%與專家相匹配。

Watson Health也有一些成功案例。IBM與北卡羅來納大學的合作夥伴在2017年發表了第一篇關於Watson for Genomics有效性的論文中,參加該研究的32%的癌症患者,Watson發現了人類從未發現的潛在重要突變。

Watson Health的故事是一個警示,每個人都喜歡雄心壯誌,但是沒人希望被放鴿子。

(聲明:本文僅代表作者觀點,不代表新浪網立場。)

關注我們Facebook專頁
    相關新聞
      更多瀏覽