身患怪病三年,求助17名醫生無果,最后竟被ChatGPT成功診斷。
這不是科幻情節,而是發生在美國一名年僅4歲的小男孩身上的真實經歷。在新冠肺炎大流行導致的封鎖期間,Courtney為她的兩個孩子購買了一個“彈跳屋”,但不久之后,她4歲的兒子Alex就開始感到疼痛。
Courtney花了三年的時間,帶著Alex先后看了17名醫生,從兒科、牙科、骨科等門診科室到各路專家,沒有一位醫生真正準確地診斷出Alex的病因。直到今年早些時候,Courtney終于從一個不太可能的來源——ChatGPT那里得到了她苦尋三年的答案。
伴隨著人工智能(AI)的飛速發展,病人就醫前求助AI醫生早已不是什么新鮮事。盡管有報告稱,與人類醫生相比,ChatGPT等生成式人工智能有差不多的水平,但許多醫生認為,基于AI的醫療工具也應該經過類似于美國食藥監局(FDA)藥品審批制度的審批程序。
17名醫生診斷無果,ChatGPT精準篩出病因
故事還要從2020年的一天說起。Alex的保姆告訴Courtney,Alex每天都要服用一種名為Motrin止痛藥,不然就會因為疼痛而大發脾氣。接著,Alex又出現了磨牙的癥狀,父母把這兩件事聯系到了一起,認為可能是由換牙或者蛀牙引起的疼痛導致的。
隨后,Alex便被父母帶著去看了牙科醫生。然而,由于牙醫檢查之后沒有發現任何問題,但提出鑒于Alex正在磨牙,推薦他們去看專業治療氣道阻塞的正畸醫生。長達三年的求醫之路就此開始。
4歲的Alex(圖片來源:today.com)
正畸醫生發現,Alex的上顎太小,導致呼吸困難,于是給Alex放置了一個擴張器。這種治療方式的確起到了效果,母親一度認為Alex的病馬上就要痊愈了。
然而,Courtney很快又發現,Alex突然不長個子了,所以隨后又去了看了兒科醫生,醫生認為Alex可能是因為感染了新冠病毒的影響,但Courtney對這個解釋并不滿意。2021年初,Courtney帶著Alex去復查,兒科醫生當時表示,Alex的個子“長高了一點”,但發現Alex的左右腳有些不平衡,建議他們選擇物理治療。
但在物理治療開始之前,Alex又出現了嚴重的頭痛癥狀,而且越來越嚴重。于是Courtney又帶著Alex去按了耳鼻喉科醫生,看看他是否因為鼻竇腔或呼吸道而有睡眠方面的問題。
Courtney認為,不管他們去看了多少醫生,專家們都只會處理他們各自所擅長領域的問題。“沒有人愿意解決更大的問題,甚至沒有人會告訴我們診斷的結果是什么。”
經歷了這番波折之后,Alex開始接受物理治療,他的物理理療師認為,Alex可能患有一種名為基亞里畸形(Chiari malformation)的疾病。根據美國神經外科醫生協會(AANS)的說法,這是一種先天性疾病,會導致顱骨與脊柱接口處的大腦出現異常。
得到這個結果后,Courtney開始對此進行研究,并拜訪了更多的醫生:一位新生兒科醫生、一位兒科內科醫生、一位成年內科醫生和一位骨科醫生,但結果仍令她非常失望——沒有任何醫生給她確切的診斷結果。
在三年的求醫之路中,Courtney前前后后帶著Alex看了17位不同的醫生,但仍沒有診斷結果可以解釋Alex的癥狀。
事情的轉折發生在今年早些時候。
精疲力竭且沮喪的Courtney注冊了ChatGPT賬號,并輸入了三年求醫所得的所有關于Alex癥狀的信息,希望能從人工智能那里找到診斷的結果。
“我一行一行地查看Alex的核磁共振記錄中的所有內容,并將其輸入ChatGPT。”Courtney說道。最終,Courtney得到了“脊髓栓系綜合征”這個答案,并加入Facebook上一個患兒家長交流群。
最后,帶著ChatGPT給出的診斷結果,Courtney拜訪了一名新的神經外科醫生,這位神外醫生看了一眼MRI就給出了和ChatGPT一樣的結論,并指出了栓系的具體位置。
“我們看了很多醫生,甚至一度進了急診室,我一直在努力。我有時整晚都在電腦前,瀏覽所有有用的信息。因此,當ChatGPT給出的建議診斷為脊髓栓系綜合征時,這非常有意義。”Courtney在接受TODAY.com采訪時說道。
AI醫療工具應通過類似藥品審批的程序
《每日經濟新聞》記者注意到,其實隨著人工智能的發展,病人求助于AI醫生早已不是什么新鮮事。
據美國全國公共廣播電臺(NPR)報道,埃默里大學醫學院的四年級眼科住院醫師Riley Lyons就表示,他經常發現病人在上門前就求助過“谷歌醫生”這類AI醫生。Lyons及兩位眼科同事近期對人工智能聊天機器人ChatGPT在診斷眼部疾病方面的準確性進行了評估。今年6月,他們在健康科學預印本在線出版商medRxiv上發布報告稱,ChatGPT與檢查相同癥狀的人類醫生相比表現相當好,而且比流行的健康網站WebMD上的癥狀檢查器表現要好得多。
此外,盡管ChatGPT偶爾會給出完全的錯誤的答案,但埃默里大學的研究報告稱,最新版本的ChatGPT在面對一組標準的眼部癥狀時,沒有做出任何“嚴重不準確”的陳述。
不僅是ChatGPT,谷歌和DeepMind研究人員開發的醫療大模型Med-PaLM已經與現實中人類臨床醫生的水平相當——Med-PaLM僅5.9%的答案被評為可能導致“有害”結果,與臨床醫生生成的答案(5.7%)的結果相似。
浙商證券在研報中指出,ChatGPT等大模型在醫療終端的應用已經包含生成個性化的醫療報告、實現在線醫療咨詢、實現自動醫療指導、審查醫療記錄和提供個性化的醫療建議五大方面。
圖片來源:浙商證券
NPR報道中稱,生成式人工智能工具提供的醫療信息的準確性的確可能比簡單從谷歌搜索有提高,但如何將這種新技術整合到醫療保健系統當中,并提供與歷史上用于引入新藥或醫療設備相同的保障措施,仍然存在很多問題。
如今,在醫療保健領域,各大公司也正致力于在放射學和醫療記錄等領域部署生成式人工智能。
然而,對于許多醫療專業人士來說,聊天機器人會帶來一系列麻煩,包括與隱私、安全、偏見、責任、透明度以及當前缺乏監管有關的問題。他們認為,基于人工智能的醫療工具應該經過類似于美國食藥監局(FDA)藥品審批制度的審批程序,但這還需要數年的時間。遺憾的是,目前還不清楚這種機制如何適用于ChatGPT這樣的通用人工智能。
每日經濟新聞