AI大時代,短短幾個月,大模型就狂風席卷。
據不完全統計,目前國內號稱投入大模型的廠商有30多家之多,市場擁堵。不同行業、不同體量、各種規模、不同層次的大模型爭流而上,各種版本讓人眼花繚亂。對于企業級市場而言,大模型距離落地是“一步之遙”,或者是“萬水千山?” 面對細分復雜的場景,如何在經濟、可信、高效的基準上,與客戶一起共創大模型,讓數字化轉型再上新臺階?
基于多年的NLP技術積累與行業實踐,面向客戶洞察和需求,追一科技全面擁抱大模型技術,自主研發領域大模型“博文Bowen”,現有AI數字員工產品矩陣也將陸續整合大模型技術和能力,進化升級,提升效能,更好助力金融、政務等領域客戶數字化、智能化升級。同時,追一科技也將與頭部客戶和合作伙伴一起,共創合作、打磨場景應用,加快推進大模型成熟落地。
AI大模型落地的三大挑戰
1、安全
不管什么樣的技術創新應用,安全都是一道紅線。從宏觀層面“安全發展”到企業自身數據安全、用戶隱私保護、合規信創的角度,都需要考量安全挑戰。ChatGPT火爆全球,出于數據跨境監管要求和國家層面數據主權安全風險考慮,政務、金融等行業不適合在業務中直接接入ChatGPT模型。從技術自主與信息安全的雙重角度來看,國產大模型獨立自主發展均具有必要性。
2、性價比
大模型的落地和商業應用,需要考慮成本的經濟性。龐大的數據、算力和研發投入成本,而場景、收益的相對不確定性,讓大模型至少在短期階段,還面臨落地挑戰。“大力出奇跡”、“暴力美學”在推高效果同時,效率也是必須關注的問題。特別是企業級市場,如何以更低成本和更高效方式,研發可精準解決垂直領域任務模型,將是一個新課題。
3、專業、可控
通過對話交互形式,ChatGPT大模型表現了極強的出圈、跨界、多任務能力。“一本正經地胡說八道”,放在一些消費級和通用場景無傷大雅,但在專業和垂直領域,如何確保“不翻車”?保證內容的確定性、專業化,真正解決用戶問題?從信息“高速公路”到終端家門口,還需要彎彎繞繞一段路。
深入領域應用實踐,追一科技大模型博文Bowen助力行業智能化
在多年的企業數字化服務實踐基礎上,追一科技緊貼安全、合規、信創等新時代智能化要求,推進創新AI技術能力應用,并不斷探索智能化應用的新范式,構建以垂直領域大模型“博文Bowen”為核心的大模型平臺能力,賦能人機對話交互和協同、分析等場景應用。在行業大模型解決方案上,錨定金融、政務領域,整合大模型能力引入到當前成熟的技術棧,提升產品效能,使客戶實現“降本增效”,并賦能更多智能化應用場景。
相比通用大模型,追一自研領域大模型將擁有更垂直適用的任務能力,可適配具體行業業務場景中的任務,如金融、政務領域中的咨詢服務、文案生成、專家決策等;在知識能力上,更有領域內縱深優勢,且保證即時性。在應用方式上,支持私有化部署,對于金融、運營商等垂直行業的特定場景,保證數據安全的同時,還能更靈活地去應對業務場景。
咨詢服務
為客戶提供高質量的精準服務,優化流程性任務的體驗,可根據客戶交互信息、歷史數據做出快速而準確的建議。例如,在金融行業的理財咨詢中,根據歷史數據與客戶風險偏好,為客戶提供金融產品或定制化個人理財建議。政務場景中,各地相關政策具有多樣性,基于大模型能力,可根據與居民/企業的交流內容,快速判定并精準適配最新政策,實現高效便民服務。
輔助生成
可根據公開市場信息及實時數據,輔助相關文案的生成。在金融領域中,可根據公開市場信息及實時數據生成時效性報告(如財經新聞、金融市場報告)與分析類報告(投研分析報告)等。在政務領域中,生成如指揮類、通聯類、公布類、記錄類、報請類等規范性公文以及如工作報告、簡報、書信、啟事類等非規范性事務公文。
專家系統
根據相關政策法規,以及與用戶對話信息做出專業、準確的判斷與決策。例如,在保險理賠中,通過與客戶的對話快速識別問題,了解損失詳細情況,更快處理理賠請求。在信貸投保審批過程中,協助銀行分析借款人的信用狀況和還款能力,協助保險公司分析投保人資格和匹配險種。在輿情監控方面,對相關輿情數據自動化處理和分析,為政策制定提供科學依據;在警務處理上,可對報警信息進行快速識別、判斷,提高決策與出警效率。
而隨著大模型的落地,除了現有AI機器人場景的升級提效外,未來將有更多場景解鎖。
深耕NLP,技術攻關極致創新
大模型的創新,離不開堅實的AI技術底座。
追一科技作為深耕NLP多年的佼佼者,在發展中一直緊密追蹤學術前沿,保持預判并率先布局前沿技術。在自然語言預訓練模型方面,先后研發了Simbert、T5-Pegasus中文模型、RoFormerV2等創新模型。自研Roformer模型中的旋轉位置編碼RoPE技術被Google、Meta、騰訊等大廠大模型采用,成為大模型的標配位置編碼方式之一。
團隊還致力于通過工程化能力,實現資源、效率、效果平衡與最優解,挖掘模型參數與訓練數據量平衡點同時保證模型涌現能力,為大語言模型研發提供保障。自研bert4keras框架,適配數十個中文開源模型,在中文NLP圈應用。自研Tiger優化器,在訓練階段將顯存優化到極致,降低訓練成本。
在領域大模型的構建中,追一科技研發團隊采用生成式預訓練+強化學習算法,將所有任務統一轉換為文本生成任務,通過采用「領域數據」預訓練+Prompt 數據微調和基于RLEF「領域專家反饋」強化學習(Reinforcement Learning from Expert Feedback),搭建垂直領域大模型。
同時,以垂直領域大模型作為核心,以其它專有模型輔助,共同支持需求,并通過知識外引與注入,如搜索、推薦、查詢等知識工具,結合知識整合模塊,整合各類垂類知識,形成一套安全可控且高度適配下游業務邏輯的完整AI系統,為客戶提供高效、高質的解決方案。