一款款AI大模型橫空出世,各行各業都在嘗試下棋落子,保險業也不例外。號稱神通廣大的AI大模型能否完美“適配”保險行業?10月10日發布的《人工智能大模型保險行業應用評測報告》(以下簡稱《報告》)便揭曉了答案。根據《報告》,10個主流大模型在知識問答領域表現普遍較好,在智能核保、智能理賠、話術優化上表現不盡如人意,在營銷服務應用能力上表現參差不齊。
業內人士表示,毋庸置疑的是,AI大模型能夠為保險業帶來具體的業務價值,不過,放大細節來看,大模型的能力還需要進一步提升。同時也可以預見,其在保險領域的應用還有很大的施展空間和潛力。
知識問答很拿手
北京商報記者獲悉,上述《報告》由元保聯合分子實驗室共同發布,為保險業內首份大模型評測報告。包括ChatGPT3.5、ChatGPT4、Claude-1、Claude-2、清華智譜ChatGLM130B、百度文心一言、阿里通義千問、科大訊飛(51.650, 0.00, 0.00%)星火、360智腦、昆侖萬維(36.620, 0.00, 0.00%)天工等市場上十大主流的大模型均在《報告》的測評范圍。
AI大模型如果用于保險客戶咨詢和問題解答,并提供即時、個性化的服務,離不開廣泛的知識儲備和準確的信息處理能力。在專業知識問答能力的表現來看,《報告》顯示,頭部大模型在專業知識問答上已有較強應用能力,可直接使用程度很高。
具體而言,在“社保與商業保險的區別?”這一入門級問題下,《報告》顯示,文心一言可從性質、建立基礎、管理體制、對象、保障范圍等9個層面給出準確答案,內容較全面。在保障范圍的區別方面,文心一言回答稱:“社會保險解決絕大多數勞動者的生活保障,而商業保險只解決一部分投保人的問題。”
此外,清華智譜也從保障對象與范圍、性質與目的、保費承擔者、保障程度與靈活性、管理機構五大維度給出了答案,同樣有較強的應用價值。
《報告》顯示,由于國內大模型廠商在中文數據語料上更加豐富,因此國內頭部大模型在回答專業領域的基礎知識問詢時,對國內情況更加了解,回答的表現也比國外大模型更加出色。
“在知識問答方面,大模型可以幫助客戶解答保險產品相關的問題,提供準確的信息和建議,提升客戶滿意度和服務質量。”中國信息協會常務理事、國研新經濟研究院創始院長朱克力表示,大模型在知識問答方面的表現相對較好,因為其可以通過學習大量的數據和語料庫來提供準確的答案。
大模型不僅適合作為智能機器人(12.430, 0.00, 0.00%)用以服務客戶,同時也可以賦能保險代理人。《報告》指出,在代理人渠道仍處于攻堅階段的當下,大模型對于提升代理人平均產能、降低保險機構服務客戶成本、促進保單成交,或有一定幫助。
營銷、風控能力待提高
相較于初級的問答,更為高級的營銷服務應用對于大模型的測評而言,更具有“含金量”。
《報告》顯示,國內外頭部大模型在營銷服務應用能力上參差不齊,特別是營銷素材設計對大模型圖像識別生成能力要求非常高,各大模型均有較大的提升空間。
如果客戶說“你們賣的保險比別人家的保險貴,我不想買了”,各家大模型如何接招?具體而言,當客戶反饋保險產品價格較高、影響了自己的購買意愿時,通義千問、GPT-4均能指出價格只是產品的一個方面,其他如保障項目、理賠率、服務能力等,也是保險選購過程中客戶需重點考慮的因素。雖然回答較為合理,不過,根據《報告》,在營銷話術上,大模型能給出的對策卻沒有很強的創新性,給出的答案也與常見的代理人答案雷同。
不同于ChatGPT和通義千問在保險營銷具體能力上平分秋色,均有相對較好得分,在合規風控應用方面,GPT-4表現一騎絕塵,在核保、理賠質檢方面均得到了最高分。
例如在詢問“因突發腦梗摔傷,意外險能否理賠”時,GPT-4對產品條款進行了多種假設,并依據不同假設給出了正確的理賠建議。《報告》指出,而國內大模型目前更擅長信息的檢索,類似于知識圖譜的能力,在邏輯推理方面還需進一步提升。
“整體而言,對于營銷應用和合規風控方面,由于涉及更復雜的業務規則和風險判斷,大模型的能力還需要進一步提升。”朱克力基于《報告》表示,由于大模型在保險領域的應用還比較新穎,生態系統和相關技術還需要進一步完善和發展,才能更好地支持大模型的應用和發展。
生態需完善
在此次評測中,不同的大模型體現出了不同的特點。
《報告》顯示,文心一言在國內大模型中體現出了較強的綜合能力,特別是中文語料充足,被評測者稱為“聰明貼心的‘中國通’”;通義千問在專業知識問答上不算突出,不過在營銷話術、智能核保、實時質檢上有相對較好的表現,被譽為“心思縝密的‘推理者’”;清華智譜的GLM-130B最大的解答優勢在于很多問題引入了生動的例子加以說明,這對于提問者而言,無疑是個亮點,也被稱為“旁征博引的‘實用者’”。
《報告》也顯示,GPT-4在多項測試中表現不俗,特別邏輯推理能力出色,是個“一專多能的‘多面手’”。不過其中文語料不足,而且高質量的中文語料更多在國內大廠,因此未來GPT-4在中文方面的領先優勢可能會削弱。
各有千秋、風格迥異的背后,從市場角度出發,大模型在保險領域?落地需要生態完善。《報告》還顯示,從本次評測呈現的結果看,AIGC在保險行業應用層面的表現尚未成熟,但AIGC為保險業務場景深度賦能的潛力已然顯現。
“下一步AI大模型在保險領域的應用還有很大的施展空間和潛力。”朱克力認為,首先,可以進一步提升大模型在營銷應用和合規風控方面的能力,通過深度學習和算法優化,提供更準確、個性化的推薦和風險評估。其次,可以結合大數據和人工智能技術,開發智能化的理賠系統,提高理賠效率和準確性。此外,大模型還可以應用于保險產品的創新和設計,通過分析用戶需求和市場趨勢,提供更具競爭力的保險產品。總體而言,AI大模型在保險領域有著廣闊的應用前景,可以為保險行業帶來更高效、智能化的服務以及管理創新機制。
在業內人士看來,《報告》的發布,一定程度上消除了保險大模型市場的信息不對稱,對于保險機構選擇大模型廠商、深度應用大模型具有非常大的指導意義。
清華大學金融科技研究院副院長、清華大學五道口金融學院中國保險與養老金研究中心主任魏晨陽表示,結合金融領域一個重要板塊(保險)的大模型評測,更具有特殊的意義。包括AI在內的科技賦能,核心在于結合具體應用場景時,模型是否在實操層面、核心業務的前沿,真正有實用價值。