——摘要:未來的計算都應該是隱私安全的計算。
近日,由清華大學五道口金融學院、清華大學國家金融研究院、清華大學研究生會聯合主辦的“未來已來—全球領袖論天下”系列講座開講。
此次講座主題為“數據:資產、共享和隱私之間”,在清華大學國家金融研究院院長、IMF前副總裁朱民的主持之下,加州大學伯克利分校計算機系教授、國際計算機協會會士、電氣電子工程師學會會士宋曉東教授與翼方健數公司聯合創始人及董事長、軟銀愿景基金管理合伙人陳恂博士針對當下數據相關等熱點問題進行演講,介紹了數據經濟、隱私安全計算的相關情況,也針對數據立法監管、行業生態發展等問題展開了熱烈的交流和探討。
宋曉東教授首先以“構建負責任的數據經濟”為主題展開演講。數據是現代經濟的關鍵驅動力,但個人和企業對數據的保護和使用在當今面臨巨大的挑戰,構建負責任的數據經濟框架刻不容緩。宋曉東認為,負責任數據經濟有三個目標原則,一是建立保護數據權益,二是公平分配數據產生的價值,三是有效使用數據來實現社會福利和經濟效率的最大化。當前亟需用安全計算、差分隱私、聯邦學習、分布式賬簿等數據技術解決保護使用中的數據、控制數據使用、保護計算輸出不泄露等傳統方案無法保證安全隱私的問題,也需要更有效的數據隱私法律監管。在未來十年,宋曉東教授樂觀地預測隱私安全計算會得到大量普及,數據信托、數據共地將占主導地位,大多數大型公司也將擁有首席負責任數據官。
陳恂博士以數據要素出發,從技術、行業規模等角度進一步展開對隱私安全計算的解讀,并對隱私安全的生態體系在商業、消費、政府、科研等應用進行了展望。
(翼方健數董事長 陳恂博士)
(1)認識當下:從信息時代步入智能時代
當下正處于一個大切換的時代,即逐步走出信息時代,步入智能時代。信息時代的特征是應用先行,有三大特點:首先,信息可以任何時間、任何地點、幾乎零成本獲取。其次,大多數數據使用者、決策者是人,數據讓我們應接不暇,每一個人都會感受到信息爆炸。最后,數據是應用的“數字排放”,是數字化服務的副產品。
智能時代的特征是數據先行,有三個大的特點:數據被機器和計算程序使用的頻率呈增長趨勢。其次,數據讓機器智能化,而智能化系統能夠處理更多數據。最后,數據優先是讓數據先于應用存在。
(2)社會發展至今,數據已逐漸成為社會中最活躍的生產要素,將創造難以預計的價值
每個時代都有當下最活躍的生產要素,特點在于生產率提高最快,對經濟增長邊際貢獻最大,是社會資源配置圍繞的中心,同時也是國家競爭力的要地。
數據作為智能時代最活躍的生產要素,是人類文明有史以來第一個一開始就是“人造”且“虛擬”的具有普適性生產要素。誰能把握和管理好最活躍的要素,誰就能更好地推動經濟社會的發展和人類進步。在智能時代,數據作為生產要素不斷爆發的生命力數據,也是國家競爭力的戰略資源。
在智能時代,從數據到服務社會的路徑可能更短,更高效,數據和知識是一體兩面的關系,數據是知識的載體,數據的流通就是知識的流通。
(3)數據要素化、數據流通的最終目的是大規模聚集和使用,賦能人工智能的突破
人工智能有三大支柱:算法、算力和數據。這三大重要因素都還有上升空間,當前算力在持續提升,而且云計算、彈性計算技術已經可以組織近乎無限的算力。算法在進步,但現有技術框架最終有局限,技術框架的突破是幾十年才會發生一次的事情,所以在短期內不太可能有這樣框架級別的進步。——數據是出路,但基本沒有釋放。
數據需要實現大規模聚集和使用來賦能人工智能實現突破成長。
(4)為什么至今還未出現大規模數據流通——應對數據要素應有充分認知和思考
還未出現大規模數據流通的原因,應從數據要素本身切入。從市場的角度出發,數據具有獨特的經濟學特征,如重復使用、固定成本高、復制成本低廉、非競爭性、非排他性、外部依賴性、生成性等,在非經濟學維度又帶有隱私、合規、機密、安全的考量。
綜合上述數據要素特點,數據的經濟學特征,尤其是可復用性與外部依賴性以及數據的非經濟學特征,例如機密、安全、隱私等,使得數據的應用和開放形成矛盾,加上現今的法律環境下,數據的所有權模糊不清。從數據的共享流通流程到規則存在需要解決的問題,都是此前沒有出現大規模的數據要素市場的原因。
(5)在數據安全與數據流通的矛盾中,隱私安全計算成關鍵技術
隱私安全計算的定義是在原始數據不交換、不暴露、不輸出的前提下,數據通過授權使用,而且能有效的輸出數據里所隱含的價值和結果,那這樣的一套技術就可以叫做隱私安全計算。換句話說,即利用技術手段讓數據的所有權和使用權分離。從技術解決了數據安全有序共享且數據受到隱私和安全保護的矛盾。
得益于中國經濟體的發展,中國的人口眾多,同時也得益于中國在大力推動整個社會和經濟的數據化,使得中國的數據發展世界領先,也催生了專攻“隱私安全計算”的公司。
在國內這個行業已經備受關注,誕生了“隱私計算四小龍”,翼方健數也有幸成為其中一。當下隱私計算企業正共同影響市場,推動市場的發展。隱私計算的市場巨大,翼方健數希望攜手并進,通過隱私安全計算技術,讓數據價值流通起來。
(6)隱私安全計算助力開拓從產業數字化到數字產業化的道路
當今數字經濟正從產業數字化向數字產業化逐步前行,但數字經濟應該以什么樣的方式存在?
從數據底座開始,孵化人工智能作為應用服務社會。就醫療健康產業來說,在大數據的基礎上利用隱私安全計算平臺管理起來,連接數據和計算,構建知識圖譜,開發人工智能模型,形成不同的產品服務產業的不同對象和不同環節。
而在這些產品服務的同時,也在貢獻新的數據,回流充實大數據基座,形成一個從產業數字化向數字產業化的遞進并實現不斷地循環提升。
(7)未來的計算都會是隱私安全的計算,構建自驅的數據和計算互聯網
此前的討論中提到“未來的計算都應該是隱私安全的計算。”翼方健數始終致力于構建“數據和計算互聯網(IoDC,Internet of Data and Computing)”。
物聯網實現萬物互聯,數據和計算互聯網連接的是數據和數據,數據和算法,算法和算法。 在這個體系之中,數據能夠充分地流通,實現數據價值,繼而積攢起多種能力,并以模型的方式出現,以引擎的形式存在,而這些引擎是靈活、可調用的,最后形成一個生態體系,滿足實際應用。而這一切的發生都是基于網絡中進行的計算方式是“隱私安全的計算”。
在討論環節,對于數據隱私計算可能面臨的問題,宋曉東教授認為:“不同的技術解決方案基于不同的假設、算法和硬件,性能也不盡相同,但大部分技術都運用到密碼學的知識”。陳恂博士也強調:“隱私安全計算是一系列方案,不同技術適用于不同場景,需要更大的市場參與,通過使用推動技術更快速地迭代”。
在數據的所有權方面,陳恂博士認為可以把數據的所有權與使用權分離,讓原始數據不流動,流動的是數據價值。如美國曾規定醫療健康的數據所有權歸病人和醫療機構共同合法擁有,但在醫療機構內,數據被按照隱私保護需求進行層級劃分,按需求流動使用,這樣的方式可供在其他領域借鑒。宋曉東教授則提到了數據權益的概念,從個人借貸、醫療保險等領域進一步舉例說明數據亟需更合理的法規來保護并支持行業發展。
最后,在數字經濟、數字生態發展上,宋曉東教授指出當下需要新的范式、新的主體幫助數據統一分配并使用。業界前沿的數據共地、數據公社就擁有技術和規則的雙方支持。另外,數據托管、信托也將會有很大的發展。
陳恂博士指出,數據生態需要有不同的參與者,數據供應方、需求方、監管方等重要角色從不同角度參與,完成生態進化,可以從單體平臺數據源,走向數據源間聯盟,最后完成計算和數據的互聯互通。