近日,以"智聯世界,生成未來"為主題的2023年世界人工智能大會(WAIC)在上海圓滿落幕。本次大會旨在搭建世界級合作交流平臺,共促發展新機遇。全球知名商業領軍者和全球創新先鋒云集于本次大會,闡述其對于新AI與新商業的見解,其中,加拿大工程院和加拿大皇家學院兩院院士、FATE開源社區技術指導委員會主席、微眾銀行首席人工智能官楊強受邀出席,分享了聯邦學習領域的前沿研學成果。
可信聯邦學習與聯邦大模型,解構大模型時代數據之困
7月7日,在由世界人工智能大會組委會辦公室主辦,中國信息通信研究院承辦,中國信息通信研究院華東分院、中國信息通信研究院云計算與大數據研究所協辦的"聚焦·大模型時代AIGC新浪潮"論壇上,楊強發表了"可信聯邦學習與聯邦大模型"主題演講。
楊強發表“可信聯邦學習與聯邦大模型”主題演講
在大模型迅猛發展的當下,對算力、數據量的極高要求是橫亙在中小型機構AI應用之路上的一道難以跨越的鴻溝。正如OpenAI CEOSam Altman所言,未來模型參數應該向更小的方向發展,或者以多個小模型協作的方式工作。
楊強指出,聯邦學習(Federated Learning)能夠聯合分散的數據、分散的算力,可應用于解決可用數據量不足的問題,從而使多方共建大模型基礎設施,為業界提供了前瞻性的解決方案。當前,FATE(Federated AI Technology Enabler)開源社區已經發布了開源的聯邦大模型功能模塊FATE-LLM,支持各參與方的敏感數據不出本地域的前提下,根據各方實際數據量進行算力投入,聯合進行大模型訓練。未來,聯邦大模型架構將重點發展同構與異構聯邦大模型、大模型指導小模型聯邦等方面,進一步提升聯邦大模型的可用性、易用性。
在聯邦學習整體研究與產業落地方面,楊強介紹,"可信聯邦學習"(Trustworthy Federated Learning)作為安全可信的多方分布式機器學習范式,具有安全可信、高效可用、可管理、可審計、普惠等核心特征,將更加適配當前產業發展所需綜合考慮數據安全、隱私保護與效率的要求。同時,楊強介紹了可信聯邦學習最新的前沿研究與應用成果,包括質效均衡的可信聯邦學習算法框架,在金融反洗錢等行業場景中的應用等。
攜手共建聯邦學習開源生態,推動數據要素安全流通
7月8日,在由世界人工智能大會組委會辦公室主辦,機器之心承辦的"AI開發者"論壇上,楊強重點作"可信聯邦學習與開源生態"主題分享,重點介紹了隱私計算和聯邦學習開源社區與生態。
楊強發表“可信聯邦學習與開源生態”主題演講
據楊強介紹,開源已成為隱私計算技術規?;钠渲幸粋€重要途徑。FATE開源社區是由聯邦學習技術開發者、行研方、產業方及生態伙伴共同組建與治理的協作創新平臺,相關參與方可以基于工業級聯邦學習開源框架FATE探索聯邦學習技術的研究與應用。FATE開源社區以"開源開放,共力創新"為愿景,匯聚了4000+社區用戶參與社區共建,覆蓋金融、醫療、科研、人工智能等多個領域與場景,不僅已成為全球領先的聯邦學習開源社區,還是可信數據流通領域最具影響力的社區之一。
在建立行業標準、推動應用場景方面,FATE開源社區的成員單位共同牽頭建立了多項聯邦學習技術標準,落地了在企業跨主體的大數據協作、企業異構平臺互聯互通、多中心醫療發現等多場景下的聯邦學習應用實踐,共同打造了包含數據提供方、模型提供方、業務提供方、價值中介方等各環節緊密結合的數據要素流通生態。
談及未來發展趨勢,楊強認為聯邦學習與開源生態將成為隱私計算、機器學習和數據科學發展的關鍵驅動力。其中,可探索的重點包括進一步完善聯邦學習安全機制;推動跨平臺的互聯互通;推動數據確權與定價和模型交易;基于"模型和數據集水印"技術的模型審計和模型全生命周期管理;推動聯邦學習與大模型、區塊鏈等技術的融合等方面,為未來的智能時代提供核心支持。