網站流量監測服務商Similarweb的數據顯示,今年以來,ChatGPT訪問量1月份的環比增長率為131.6%,此后逐月下降。到6月份,ChatGPT的全球流量出現首次下降。可見,大模型的發展逐漸駛入深水區。而大模型的產業化落地,將成為下一階段思考的重點。
近日,醫渡云首席數據科學家彭滔博士在世界生命科學大會“2023AI大模型醫療場景應用論壇”上發表了主題演講,分享了AI大模型在醫療行業的技術和模式創新。他指出,通用大模型不能徹底解決用戶的所有問題,未來大模型市場是基礎大模型、行業大模型以及細分場景模型并存的格局。尤其是醫療領域,其嚴肅性、敏感性、專業性等特殊性,決定了醫療行業需要高質量的專業垂類大模型。
彭滔將大模型的應用生動地比喻為“雇傭新員工”,公司會關注其教育背景,也會對員工進行培訓從而更好地適配業務。兩者的不同之處在于,教育更側重于理論知識的傳授和推理能力的培養,培訓則更傾向于實踐性的技能傳授以及技能應用的演練。在大模型落地應用中,教育和培訓都是必不可少的環節。
目前,醫渡科技正在研發醫療垂直領域的大語言模型。在模型“教育”階段,醫渡科技基于其豐富的醫療專業知識儲備、行業know-how及特有的算法和技術,使醫療垂類大模型相對于通用大模型能夠更好地理解醫療行業需求,提供更精準、專業的回答。
彭滔表示,經過“教育”的大模型已經可以在知識檢索查詢、醫療過程中不良事件的提取和判斷等醫療場景中進行應用。舉例來說,在藥物或醫療器械研發中,安全性是基本要求。因此,對于不良事件的提取和評估至關重要,需要從臨床病例中提取信息,例如事件發生時間、結束時間、具體使用的藥物、事件的嚴重程度以及與研究藥物的關聯性等,大模型技術在這個過程中展現出了強大的理解、特征提取和推理能力。(如下圖所示)
但醫療垂類大模型的潛力遠不止于此,彭滔表示,從醫院到藥企、保險以及患者等各個醫療場景中,都可以受益于醫療垂類大模型的能力,“幾乎所有的醫療產品或路徑,都可以用醫療垂類大模型去重新梳理一遍,去真正發揮它的價值”。可泛化可循證的CDSS、可以給出科研靈感的科研工具、可以溯源及開放的大數據平臺等,醫渡科技正在重新思考和構建這些場景下的大模型應用。
但要想真正打通大模型落地醫療的“最后一公里”,讓其在更多場景中發揮更大價值,還需要對醫療垂類大模型進行“培訓”,這一過程更多依賴的是場景經驗與反饋。醫渡科技在醫療智能領域深耕多年,醫療場景實踐經驗豐富,并且內部人才團隊80%以上都具備醫學或AI、大數據技術背景,在“培訓”方面具備充足的資源支持。
彭滔以識別和錄入電子病歷數據的場景為例,在臨床試驗中的很多場景中,由于合規、隱私等因素,醫院無法提供電子文本,臨床研究協調員(CRC)這一角色就需要將醫學檢驗單上的數據手動錄入系統,完成類似打字員的轉錄工作。彭滔指出,很多客戶和合作伙伴期待能使用OCR技術解決這個問題,但由于圖像質量問題,以及每家醫院具有特殊規則和方法的原因,傳統OCR的通用性在不同醫院受到了極大限制。
為了解決類似的具體場景問題,醫渡科技嘗試通過場景專家與工程師溝通,再訓練AI模型的方式,然而這種方式也存在成本較高的缺陷。針對此,彭滔在論壇上提出了一種新機制,即讓一線人員通過自然語言直接與大模型交互,讓他們能夠向模型傳達現場經驗的規則。“自然語言有非常強大的表達能力,通過場景專家與AI的交流,可以解決不同場地繁雜的差異,當然它也存在天然的歧義和不精確性。展望未來,每個行業都會發展出與AI協作的語言。”彭滔暢想道。
此外,AI大模型在醫療場景應用也需要考慮更多的倫理與安全合規問題。彭滔呼吁監管的調整和行業共識的形成,以使AI的應用符合倫理和合規要求,并指出隨著時間的推移,各行業都將面臨這個問題,未來人類社會或將逐漸向人機共存的方向轉變。
新一輪AI浪潮已至,醫渡科技積極擁抱智能時代的新機遇,期待通過推動醫療垂類大模型的創新與應用,為醫療健康領域帶來更高效、精準和安全的人工智能解決方案,促進醫療產業的高質量發展,最終讓更多患者受益。