11月27日,由中國人工智能學會、杭州市人民政府主辦,開放群島(Open Islands)開源社區、FATE開源社區具體承辦,深圳數據交易所、華為云、金智塔科技協辦的“2022全球人工智能技術大會可信數據流通智能技術應用發展論壇”成功舉行。
香港科技大學計算機與工程系講座教授和前系主任、中國人工智能學會(CAAI)榮譽副理事長楊強,上海交通大學講席教授、日本工程院外籍院士李頡,恒生電子首席科學家、研究院院長、上海證券交易所原總工程師白碩,華為公司數據總架構師馬運,復旦大學軟件學院教授、副院長韓偉力,浙江大學人工智能研究所副所長、杭州金智塔科技首席科學家鄭小林,深圳數據交易所副總經理、董事王冠,上海數據交易所副總經理、上海大數據應用創新中心主任盧勇,北鵬前沿科技法律研究院理事、副院長、開放群島(Open Islands)開源社區法律合規工作組組長王青蘭等10余位專家學者、企業代表出席會議并發表主題分享。
聚焦可信數據流通技術應用發展,促進數據價值釋放
在主題分享環節,出席嘉賓分別從如何高質量挖掘數據價值,構建安全、合規、可信的數據流通體系、底層技術創新等方面進行深入講解與交流,多角度闡述了可信數據流通智能技術與數據要素交易體系建設實踐,為數據要素可信流通與應用開闊了思路。
恒生電子首席科學家、研究院院長、上海證券交易所原總工程師白碩從稀缺性技術視角,分享了元宇宙虛擬物的流通痛點。白碩認為,虛擬物的互聯互通才是元宇宙的本質特征,只有在頂層設計、互聯互通互操作協議層面取得重大進展,元宇宙才會有實質性創新。
白碩表示,談論元宇宙互聯互通,不僅是虛擬物的互通,也需使虛擬物所承載的權益互通。而虛擬物的表現形態為數據,虛擬物的交易流通本質上是數據的交易流通,稀缺性的技術支撐,能夠為虛擬物實現定價與賦權,成為虛擬物漫游、拼裝、改造的核心要素。“懂得通過組裝數據‘碎片’形成價值較高的數據產品,才能在數據要素的定價中找到自己的增值點。”白碩總結道。
復旦大學軟件學院教授、副院長韓偉力介紹了安全多方學習技術的最新進展與未來發展方向。韓偉力表示,數據要素可信流通的關鍵是在數據安全與數據價值釋放間取得平衡。數據通常分布在不同機構,且受到法律法規的保護,如何在數據可用不可見的前提下,充分利用不同機構數據,并訓練為高性能機器模型成為一個關鍵挑戰。
據韓偉力介紹,基于安全多方計算(MPC)實現的隱私保護機器學習的技術、框架與平臺等安全多方學習(MPL)應用,目前其團隊開發出了國內高校首個開源安全多方學習平臺。該平臺實現了基于Shamir秘密共享、加法秘密共享、向量空間秘密共享協議的多種安全多方計算算子,以及安全多方統計分析和線性回歸、邏輯回歸、BP神經網絡等主流機器學習模型的訓練。其中PEA模型實現了多方數據共享場景下的訓練過程的可證明安全和訓練結果的可度量安全,pMPL框架中引入的特權方設置突破了當前基于安全多方計算的機器學習中所采用的對等結構不符合常見商業場景這一根本性缺陷。因此FudanMPL可以支撐起金融風控、智慧醫療等隱私敏感場景的數據協作需求。未來,伴隨與不同安全模型的適配、安全性的可證明與可度量、與聯邦學習加速融合,以及通過標準化實現與其他隱私計算框架的互聯互通,安全多方學習將迎來進一步發展。
北鵬前沿科技法律研究院理事、副院長、開放群島(Open Islands)開源社區法律合規工作組組長王青蘭根據數據要素合規服務的創新與實踐經驗,介紹了數據要素流通科技合規服務體系的新范式。王青蘭表示,數據要素開發利用的前提是合規,隨著立法的完善與監管效率的提高,數據要素流通的合規性門檻逐漸提升。
王青蘭認為,標準化、智能化、場景化的合規服務創新,將成為平衡數據合規與數據利用的關鍵路徑。據王青蘭介紹,目前北鵬前沿科技法律研究院已經形成個人信息保護法律合規智能評估系統,該系統可快速針對企業應用場景提供智能評估報告,幫助企業在滿足監管合規前提下,促進數據的開發利用。
同時,北鵬前沿科技法律研究院也與深圳數據交易所深度合作,成立開放群島(Open Islands)開源社區的法律合規工作組,并在由百度云、FATE開源、開放群島開源社區、京東科技、騰訊云共同發起的隱私計算開源協同計劃中組建了法律合規團隊,共同探索建立數據要素的開放創新生態,落地符合產業需求的數據流通合規指南。
推進政務公共數據市場化配置與融合應用,探索“一體化”協同創新
在圓桌討論環節,浙江大數據交易中心總經理沈旭東,湖州市數字集團總經理王震,科大訊飛智慧城市事業群副總裁、訊飛大數據研究院院長譚昶,貴陽大數據交易所總助兼市場部總經理黃煜,FATE開源社區運營專委會主席、開放群島(Open Islands)開源社區委員會運營組組長潘菲等與會嘉賓,以政務公共數據市場化配置與融合應用為主題,圍繞政務公共數據流通共享的背景及內涵,政務數據治理、交易體系建設重點、難點、關鍵技術及驅動數據與場景協同創新等議題進行了熱烈討論。
浙江大數據交易中心總經理沈旭東表示,政務公共數據是政府部門履行職能過程中產生或使用的重要資源,蘊藏難以估量的經濟發展、社會運行以及國家戰略價值。實現對政務公共數據的精細化運營在數據要素市場培育過程中將起到重要的引領與示范作用。對政務大數據一體化而言,技術并非主要的制約和挑戰,更關鍵的可能是區域治理機制間的差異。就浙江本地而言,浙江的數字化改革、數字經濟發展程度在全國是名列前茅的,這對于我們發展數據交易、數據要素市場化是一個優勢。目前,浙江省已建成省市區(縣)三級數據一體化、智能化公共數據服務平臺體系,這對接下來的政務數據應用發展而言,將會是一個先發優勢。
湖州市數字集團有限公司總經理王震分享了湖州市在政務公共數據流通領域的探索和建設成果。王震表示,湖州是“綠水青山就是金山銀山”理念的誕生地,地處長三角的地理中心,被納入上海都市圈和杭州都市區范圍,在數據要素流通特別是綠色低碳領域已有較多經驗和成效,將為“大數據”與“雙碳”兩大國家戰略深度融合提供有力探索和支撐。
同時,王震也表示,當前數據要素市場還處于初始階段,實用制度建設、市場內生動力等方面還存在一定挑戰。從近期湖州四大綠色數據領域對接的銀行機構、竹林碳匯、電碳等場景方訴求來看,如何制定靈活、符合行業特點的制度,并根據場景需求進行針對性的數據開發,探索出數據生態高效協同的落地路徑,將是提高地區政務數據開放共享規模與市場內生動力的重要舉措。
科大訊飛智慧城市事業群總副總裁、科大訊飛大數據研究院院長的譚昶介紹了科大訊飛參與安徽數字政府、智慧城市建設經驗。據譚昶介紹,科大訊飛參與了安徽省數據局江淮大數據中心的建設。通過采用“1+16+N”架構,即1個省級總平臺,16個地市平臺,以及N個部門的分平臺。目前已連接了57個省直的部門,總體匯集的數據也已經達到了230億條,數據共享交換累計數量已達到5600億條。
據譚昶介紹,目前,安徽已成立數字安徽集團支持全省政府信息化建設,并與科大訊飛建立了羚羊工業互聯網平臺,在工業互聯網以及企業工業數據應用方面,將科大訊飛的人工智能、大數據技術優勢和安徽省先進制造業,智能網聯,白色家電等等行業緊密結合,支撐安徽省大型企業或者中小型的企業數字化轉型。
貴陽大數據交易所總助兼市場部總經理黃煜介紹了貴陽大數據交易所在數據治理、流通運營等方面探索。貴陽大數據交易所總助兼市場部總經理黃煜表示,公共數據運營的關鍵是從場景出發,形成按貢獻決定價值的收益共享機制。貴陽大數據交易所成立于2015年,是全國首家以大數據命名的交易所,依法依規面向全國提供高效便捷、安全合規的市場化數據流通交易服務。
黃煜表示,根據貴州省公共數據的特色優勢,我們提供了整個企業數據和公共數據融合的場景和平臺,從而來挖掘更多的數字經濟新產業和新模式。其中云上貴州公司作為貴陽大數據交易所數據商,依托貴州政務云創新模式,實現了全省省級部門政務數據的匯聚,通過場景和業務需求挖掘數據產品和服務,從數據共享開放、清洗加工、開發利用、流通交易,形成數據全生命周期產業鏈。目前已在貴陽大數據交易所已經上架了23個政務公共數據產品,其中包含了公積金,社保,不動產,稅務,婚姻,公共資源交易等,涉及的場景有勞務用工,公共資源交易和普惠金融。
FATE開源社區運營專委會主席、開放群島(Open Islands)開源社區委員會運營組組長潘菲表示,隨著國家政務公共數據共享交換平臺的建設,政務數據流轉日益頻繁,且呈現出從有限流動到廣泛流動的新特性。
因此,在數據要素市場培育過程中,既需要技術專家的創新支撐,持續探索聯邦學習、隱私計算、區塊鏈等數據保護前沿科技應用;也需要法律專家在可信標準、法律法規的角度予以引導協同;同時,也要連接更多數據流通相關的數據管理部門、各地數據交易所等交易規則制定方,設計制定更具包容性、更具生命力的市場規則,共同構建一個有章可循,有規可依的數據流通交易生態。