9月3日,在2022世界人工智能大會(WAIC 2022)“數(shù)據(jù)要素流通技術(shù)前沿探索論壇”期間,清華大學(xué)深圳國際研究生院知識工程研究中心、北京智譜華章科技有限公司、開放群島開源社區(qū)聯(lián)合發(fā)布了《2022聯(lián)邦學(xué)習(xí)全球研究與應(yīng)用趨勢報告》。清華大學(xué)計算機系教授、博士生導(dǎo)師、清華大學(xué)人工智能研究院知識智能中心主任李涓子以現(xiàn)場連線的方式對報告進行了解讀,隨后,與中國人工智能學(xué)會(CAAI)榮譽副理事長、香港科技大學(xué)計算機與工程系講座教授、前系主任楊強及清華大學(xué)計算機系教授、副系主任唐杰展開圓桌討論,深度探討了全球聯(lián)邦學(xué)習(xí)熱點議題。
聯(lián)邦學(xué)習(xí)2016年被提出以來,從最初在通信終端上“保護用戶隱私”的嘗試,到目前在泛行業(yè)中的“安全護航”,已成為最受關(guān)注的隱私計算技術(shù)之一。2022年,聯(lián)邦學(xué)習(xí)已全面進入2.0時代,技術(shù)正在更加安全、高效、廣泛地運用于產(chǎn)業(yè)端。
“中美雙雄”引領(lǐng)全球聯(lián)邦學(xué)習(xí)發(fā)展,算法模型與安全隱私技術(shù)是研究重點
該報告從全球角度洞察聯(lián)邦學(xué)習(xí)領(lǐng)域的科研論文發(fā)表、專利申請、學(xué)者地圖與畫像、主流框架與行業(yè)應(yīng)用的進展情況,以及技術(shù)發(fā)展趨勢與前景。
據(jù)李涓子介紹,本報告的一大亮點是建立了聯(lián)邦學(xué)習(xí)知識樹,圍繞知識樹中的相關(guān)知識節(jié)點,從技術(shù)研究、框架和系統(tǒng)以及行業(yè)應(yīng)用對聯(lián)邦學(xué)習(xí)的研究和應(yīng)用現(xiàn)狀進行了綜述梳理,在這個基礎(chǔ)上,從不同的方面對聯(lián)邦學(xué)習(xí)的發(fā)展趨勢進行了預(yù)測。從論文、專利等角度對現(xiàn)在的研究熱點和研究者以及相關(guān)的開源框架進行了分析。
報告顯示,從論文發(fā)布及“高被引用論文”數(shù)量、全球?qū)@芾砹考伴_源框架熱度等幾個方面來看,“中美雙雄”正在引領(lǐng)全球聯(lián)邦學(xué)習(xí)發(fā)展。
中國和美國的聯(lián)邦學(xué)習(xí)論文發(fā)布量遙遙領(lǐng)先于其他國家。高被引論文之中有六成以上是來自中美兩國,中美兩國論文合作數(shù)量在全球范圍也是最多;聯(lián)邦學(xué)習(xí)全球高被引論文領(lǐng)先的機構(gòu)依次是谷歌、卡內(nèi)基·梅隆大學(xué)、北京郵電大學(xué)及微眾銀行。
而專利受理數(shù)量方面,中國則是更為突出。全球?qū)@芾頂?shù)量以中國地區(qū)最多,約占全球受理總量的六成,專利申請數(shù)量前三名機構(gòu)全部是中國機構(gòu)。
聯(lián)邦學(xué)習(xí)的主流開源框架則主要來自中美,其中 OpenMined 推出的 Pysyft、微眾銀行的 FATE 和谷歌的 TFF 框架的熱度居于全球前三位。
通過大量案例梳理,報告指出,未來聯(lián)邦學(xué)習(xí)研究趨勢將更多與算法模型和安全隱私技術(shù)相關(guān)。報告顯示,目前聯(lián)邦學(xué)習(xí)研究熱點主要聚焦在機器學(xué)習(xí)方法、模型訓(xùn)練、隱私保護三方面;未來幾年研究趨勢將更多涉及算法模型和安全隱私技術(shù),如數(shù)據(jù)隱私、深度學(xué)習(xí)、差分隱私、邊緣計算、物聯(lián)網(wǎng)、云計算、移動設(shè)備、同態(tài)加密、優(yōu)化問題、溝通效率等。行業(yè)應(yīng)用越來越成熟,應(yīng)用研究方向呈現(xiàn)出更多與物聯(lián)網(wǎng)、區(qū)塊鏈、車輛交互、5G/6G等技術(shù)融合的態(tài)勢。
技術(shù)突破與產(chǎn)業(yè)融合相伴相生,是聯(lián)邦學(xué)習(xí)的顯著特征
經(jīng)過多年發(fā)展,全球聯(lián)邦學(xué)習(xí)勾勒出了怎樣的人才畫像?中外隱私計算、聯(lián)邦學(xué)習(xí)的研究和應(yīng)用方面有何異同?在物聯(lián)網(wǎng)和邊緣計算的應(yīng)用中如何最大化保護數(shù)據(jù)及應(yīng)用數(shù)據(jù)?算法模型和安全隱私在物聯(lián)網(wǎng)和邊緣計算中的融合趨勢是什么?對未來的技術(shù)融合有哪些設(shè)想?
以報告為切入,李涓子、楊強、唐杰三位教授圍繞如上聯(lián)邦學(xué)習(xí)全球熱點話題展開深度討論,為業(yè)界呈現(xiàn)了一場重量級“聯(lián)邦學(xué)習(xí)尖端對話”。
楊強介紹說,“聯(lián)邦學(xué)習(xí) 近幾年進展非常迅猛,(論文)從2018年每年二三十篇,到現(xiàn)在上千篇,發(fā)展速度非常快。中外研究側(cè)重確實是有區(qū)別的,比如美國的研究大部分側(cè)重于橫向聯(lián)邦學(xué)習(xí)。中國更注重縱向和異構(gòu)聯(lián)邦學(xué)習(xí)。”
楊強進一步解釋道,橫向聯(lián)邦學(xué)習(xí)以云計算為中心,有一到多個服務(wù)器,面對的是眾多終端設(shè)備,需要一個全局的模型優(yōu)化,并在這個過程當(dāng)中保證數(shù)據(jù)不出本地、數(shù)據(jù)不出庫、模型得到保護等;而異構(gòu)聯(lián)邦學(xué)習(xí)則強調(diào)當(dāng)數(shù)據(jù)分布不一樣的情況下,結(jié)合機器學(xué)習(xí)來實現(xiàn)“數(shù)據(jù)不動模型動,數(shù)據(jù)可用不可見”。他強調(diào),既要保障效率和效果提升,又要保證安全,這是中外研究者的一致目標(biāo)。
唐杰認(rèn)為,在研究算法、加密方法、共享機制和切分及聯(lián)邦學(xué)習(xí)的方法論上,全球都有一些共通之處。而在中國,有其鮮明特色,即國家層面的支持、學(xué)術(shù)界和產(chǎn)業(yè)界的高度融合。他表示,以開源平臺來看,中國的聯(lián)邦學(xué)習(xí)生態(tài)處于世界領(lǐng)先水平,頂層的引領(lǐng)、學(xué)術(shù)界的核心研究能力和產(chǎn)業(yè)界的技術(shù)、數(shù)據(jù)能力整合程度非常高。從長遠(yuǎn)來看,國內(nèi)的數(shù)據(jù)規(guī)模更大,對于聯(lián)邦學(xué)習(xí)的需求更大。“生態(tài)化發(fā)展思路加上更大的數(shù)據(jù)市場”,從這個角度來看,會促進聯(lián)邦學(xué)習(xí)未來在國內(nèi)的快速發(fā)展。
聯(lián)邦學(xué)習(xí)未來趨勢:技術(shù)融合與生態(tài)繁榮
關(guān)于未來技術(shù)融合,楊強表示,物聯(lián)網(wǎng)和聯(lián)邦學(xué)習(xí)的融合新趨勢非常明顯,國內(nèi)的初始爆發(fā)點在金融場景中,正在快速擴展到邊緣計算。邊緣計算在工業(yè)上應(yīng)用非常多,大家熟知的無人車、智能家電、穿戴式醫(yī)療都離不開邊緣計算,邊緣計算也是未來計算的范式。而從一個中心的大計算范式,到多個計算中心的協(xié)同計算過程中,如何達(dá)到既高效又可靠安全的效果?聯(lián)邦學(xué)習(xí)就自然而然被提出,這也說明了聯(lián)邦學(xué)習(xí)已經(jīng)在向其他產(chǎn)業(yè)領(lǐng)域快速滲透的趨勢。
關(guān)于共享的下一步,唐杰分享了最新的思考:“現(xiàn)在熱度比較大的是物聯(lián)網(wǎng)和邊緣計算。隨著未來生態(tài)發(fā)展、市場需求發(fā)展,我個人認(rèn)為爆發(fā)點在云上,在各個互相不同的云,以及在一個云上不同機構(gòu)之間的數(shù)據(jù)共享和計算。隨著聯(lián)邦學(xué)習(xí)聯(lián)盟的發(fā)展,我相信在未來還有可能從單純的數(shù)據(jù)共享變成模型共享。比如有可能每個機構(gòu)做模型計算,最后分享出來的是計算出來的中間結(jié)果或者最終結(jié)果,這樣變成模型聯(lián)邦的大平臺。”
2018年以來,以在金融場景中的實踐為發(fā)端,聯(lián)邦學(xué)習(xí)產(chǎn)業(yè)化進程加快。廣度迅速延展至醫(yī)療、智慧城市、自動駕駛等大行業(yè)或產(chǎn)業(yè)中,深度演進至與物聯(lián)網(wǎng)、區(qū)塊鏈、5G/6G 等技術(shù)融合。在越來越多的場景中,聯(lián)邦學(xué)習(xí)已然不是備選項,而是必選項。
通過“建立并豐富聯(lián)邦學(xué)習(xí)生態(tài)”來實現(xiàn)和推動技術(shù)成果的市場化、商業(yè)化已成為業(yè)界共識。而開源平臺、技術(shù)標(biāo)準(zhǔn)、行業(yè)應(yīng)用等多方面的協(xié)同發(fā)展共同支撐起技術(shù)生態(tài)的繁榮。截至目前,聯(lián)邦學(xué)習(xí)領(lǐng)域已經(jīng)由企業(yè)或行業(yè)聯(lián)盟協(xié)會發(fā)起并發(fā)布了多個國際標(biāo)準(zhǔn)和國家級團體規(guī)范;FATE、開放群島(Open Islands)等開源社區(qū)在促進全國性資源開放共享、推動數(shù)據(jù)要素流通方面已取得了初步成果。隨著更多行業(yè)的更多企業(yè)和機構(gòu)加入和布局聯(lián)邦學(xué)習(xí)技術(shù)的應(yīng)用,聯(lián)邦學(xué)習(xí)生態(tài)逐漸從當(dāng)前的跨地域、跨平臺互聯(lián)互通向開放、通用的方向進發(fā)。
在全球大數(shù)據(jù)時代,聯(lián)邦學(xué)習(xí)正成為新型的“技術(shù)基礎(chǔ)設(shè)施”,有望成為下一代人工智能協(xié)同算法,隱私計算和協(xié)作網(wǎng)絡(luò)的基礎(chǔ),使得數(shù)據(jù)在合法合規(guī)、安全高效邊界內(nèi),實現(xiàn)真正的價值流動。