近年來隨著AI技術的規模化產業落地,發展“可信AI”已成為全球共識,也是未來人工智能健康發展的必由之路。9月1日-9月3日,2022世界人工智能大會(WAIC)期間,可信AI議題也備受業界關注。作為人工智能領域代表性企業,星環科技在可信AI領域進行了諸多探索,在本屆世界人工智能大會上,星環科技不僅圍繞可信AI與業界大咖進行了觀點分享,還帶來了可信AI成果。
9月1日下午,在由中國信息通信研究院、京東探索研究院聯合主辦的WAIC 2022 · 可信AI論壇上,星環科技首席隱私計算科學家伊人與中國信通院華東分院人工智能與大數據事業部主任陳俊琰、京東探索研究院算法科學家&可信 AI 主任何鳳翔、螞蟻集團機器智能部總經理&螞蟻安全天筭實驗室主任王維強、中國科學技術大學電子工程與信息科學系副教授田新梅圍繞“共建可信人工智能產業生態”進行了深度圓桌交流。
9月3日下午,在中國信通院云計算與大數據研究所、螞蟻集團、機器之心主辦的WAIC 2022 · 可信隱私計算高峰論壇上,星環科技高級研究員夏正勛及研究員唐劍飛還進行了《可信AI治理框架探索與實踐》論文講解,深入介紹以“數據可信、算法可信、計算可信、管理可信”為中心的端到端T-DACM可信AI治理框架。
可信AI前景廣闊,數據全生命周期的AI可信是未來趨勢
對于如何開放協同,共建多元化的可信人工智能產業生態,伊人表示,在共建可信人工智能產業生態的實踐中,一是對各行業不同問題,形成跨學科、專業化的可信AI解決方案;二是需要做出技術上的突破來提供好用的工具對AI的結果進行評估和量化,比如減低夏普利值的計算復雜度,研發一些好用的可視化工具;三是需要做到數據-AI模型-業務全鏈路的可信。
同時,伊人表示可信AI或者說解決AI的信任問題是AI規模應用的前提,所以可信AI在整個企業應用中有著很重要的價值和前景。從技術角度看,技術提升帶來產業提升,星環科技也根據市場需求研發了XAI可解釋性以及隱私計算,以及MLOps模型運維組件等,基于軟件幫助客戶能夠理解并信任模型,并且將模型能夠真正應用到實際的生產環節中,給企業帶來效益的提升;可信人工智能未來發展趨勢是從模型驅動轉為數據驅動,從數據采集、數據傳輸、存儲、治理、建模、應用的全生命周期來達到AI可信;而在治理方面,首先是根據可信AI的實踐經驗形成行業規范、標準在全國進行推廣,甚至達成全世界的共識。
“數據、算法、計算、管理”,T-DACM端到端的可信AI治理框架
為實現數據-AI模型-業務全鏈路的可信,星環科技從技術和管理兩個維度出發,提出了一種通用的可信AI治理框架T-DACM (Trusted Data & Algorithm & Computation & Management)。T-DACM 可信AI治理框架具體包含可信數據、可信算法、可信計算、可信管理四個層次,覆蓋了數據安全、模型安全、隱私保護、風險控制、過程管理、可解釋性、公平倫理、追溯追責等AI熱點問題的解決方法,為企業及監管機構提供了一種可行的可信AI解決方案。
T-DACM 可信AI治理框架由下而上分為四層,分別是可信數據(Trusted Data)層、可信算法(Trusted Algorithm)層、可信計算(Trusted Computation)層與可信管理(Trusted Management)層 ,其中:
可信數據層為可信AI提供了數據基礎。其具體包含異常數據檢測、偏倚消除、偏見消除、數據增強等組件,可以檢測異常樣本保證模型能夠正常工作,對異常、異質性數據進行處理,引入公平性算法消除數據中的歧視與偏見,通過樣本變換或者樣本生成來擴增數據集,增強模型魯棒性;
可信算法層為可信AI提供安全與強魯棒性的核心能力。其除了現有算法外,還包含因果算法、公平算法、模型增強等算法組件,可以從數據中發現穩定特征,提高模型對不同環境的適應能力,去除模型的決策邏輯對于弱勢群體的歧視,提升了模型對于常見攻擊方式的防御能力;
可信計算層為可信AI提供可信計算的能力。其具體包含加密算法、可信計算、計算調度等模組,可以使用加密算法及TPCM(Trusted Platform Control Module)可信平臺控制模塊保障單方計算場景下的數據安全,使用聯邦學習、聯邦計算、多方安全計算(Secure Multi-Party Computation,MPC)等組件為多方參與的模型訓練、模型推理、計算等提供數據安全及隱私保護;
可信管理層為可信AI提供可追溯、可監管、可理解的管理能力。其具體包含追溯追責、公平倫理查驗、可解釋性三個組件, 可以通過事故發生之后的回溯對責任進行認定,分析系統的實時行為來監控違反法規倫理的行為,對模型的決策邏輯進行解釋,為模型的優化提供參考。
T-DACM可信AI治理框架基本覆蓋了AI從模型學習、模型應用到系統管理的全流程,以個性化保險定價為例:可信數據層使用Relabelling算法消除數據集中對弱勢群體的偏見,可信算法層使用Regularization 增強定價算法的公平性,可信計算層使用聯邦學習計算框架在保護隱私的前提下聯合第三方銀行數據共同建模,定價結果更準確可信,在可信管理層既能回溯某一定價的決策過程并作出解釋,也能實時檢測在運行過程中整個定價系統是否存在違反法律、倫理規則的行為。通過T-DACM可信AI治理框架內層與層之間的無縫協作保障AI系統全流程的可信性。T-DACM可信AI治理框架可以有效提升模型精度,并解決模型黑盒問題。以某銀行授信系統為例,通過縱向聯邦學習組件利用第三方風控數據進行聯合建模,從數據優化的維度提升模型精度至99.2%。對于客戶資源損失的問題,使用隱匿集合求交功能,實現與第三方社交媒體用戶資源的匹配,從而找到失聯客戶,并進行接觸推廣,最終將失聯用戶率降低至0.4%。對于模型黑盒問題, 通過引入模型可解釋模塊,解決了對客戶的評分差異無法解釋的問題。星環科技提出的T-DACM可信AI治理框架結合數據、算法、計算、管理四個維度的可信方法,提供了一個端到端的可信AI解決方案,并率先在產業界進行了實踐與落地。然而,可信AI是一件任重而道遠的事情,當前模型的黑盒仍未完全解開,徹底的可信尚未達到,相信隨著人們對AI研究愈加深入、新方法新技術的不斷提出,可信AI框架必將越來越完善。