近日,由DataFun主辦的第三屆數據科學在線峰會盛大舉辦。聚焦機器學習與數據挖掘、AB實驗、因果推斷、數據中臺與數字化轉型、用戶增長與運營、數據科學最佳實踐等6大數據科學主題,數十位國內外一線數據科學家圍繞數據科學前沿技術成果和應用實踐經驗深入分享和交流。九章云極DataCanvas公司深度參與峰會,并分享前沿數據科學技術的最新研究進展。
峰會上,九章云極DataCanvas公司AI架構師何剛發表“AIGC與因果推斷的雙向賦能”主題演講,探討近期人工智能高熱技術AIGC和經典技術因果推斷的融合創新可能。
何剛表示,AIGC在非結構化內容的生成中表現驚艷,對于結構化數據分析目前還處于空白狀態,而因果推斷則是當前結構化數據分析領域最受矚目的關鍵技術之一;以Agent-Based Modeling(ABM多智能體建模)為橋梁,可以構建AIGC與因果推斷的鏈接,并實現AIGC與因果推斷的雙向賦能。
ABM多智能體建模
ABM多智能體建模是一種用來模擬具有自主意識的智能體的行動和相互作用的計算模型,具有高仿真性、涌現屬性、可解釋性等優勢。ABM的運行模式是在不同的參數組合下進行仿真運行,運行過程中可以輸出數據,并將數據存儲下來形成數據集,是非常完整且具有反事實可獲取、特征完整性、可控制性等優質特性的數據資產。經驗證,從ABM系統中獲取的優質數據在因果推斷中的因果效應估計、因果發現、評價指標等領域都具有很好的適用性,突破因果推斷研究領域無反事實樣本的限制。
ABM為因果推斷提供優質的數據基礎
由此可見,ABM多智能體建模非常適合作為AI載體,實現AIGC從非結構化數據到結構化數據生成的拓展,彌補AIGC在結構化數據領域的短板。
同時,因果推斷將加速ABM多智能體建模流程,尤其在校準數據和涌現分析這兩個重要流程環節表現優異。在校準數據環節,通過將因果效應估計應用到參數分析,可以更貼近校準目標、加速仿真的校準過程,加快推進業務推演和輔助決策;在涌現解釋環節,通過組合因果發現算法生成因果圖,將因果發現、機器學習、敏感性分析技術相結合,可以對涌現行為做出更豐富的解釋,進一步增強涌現解釋能力。
結合九章云極DataCanvas公司近年來在因果推斷領域的理論創新成果和YLearn因果學習軟件這一開源重器的研發經驗,何剛提出,拓延AIGC產生結構化數據能力,利用AIGC生成因果學習模型報告,以及應用因果推斷拓展AIGC的因果解釋能力可以成為未來因果推斷與AIGC技術深度融合的三個研究方向。
由九章云極DataCanvas公司開源發布的YLearn因果學習軟件,是全球開源工具中唯一能夠端到端地解決“因果發現、因果量識別、因果效應估計、反事實推斷和策略學習”五大因果學習任務的軟件工具。YLearn突破了機器學習基于相關關系建模的局限性,發掘數據中穩定的因果關系,實現在反事實條件下的推斷,可以充分賦能ABM多智能體建模,助力AIGC涌現能力的挖掘。
未來,作為以“硬科技”立身的人工智能基礎軟件供應商,九章云極DataCanvas公司將持續專注AI基礎能力研發領域,進一步推動AIGC與因果推斷等前沿技術的融合創新,并加速前沿技術的產業化應用,為AI熱潮貢獻一份自主創新能量。