數據,是人工智能技術的三大基礎之一。而數據安全,或將成為智能時代更快到來的“鐵軌”與“基座”。
隨著信息技術和人類生產生活交匯融合,各類數據迅猛增長、海量聚集,對經濟發展、人民生活都產生了重大而深刻的影響。而數據在收集、存儲、共享的過程中同時面臨收益與風險。
如何確保數據安全,并做到“可用不可見”,至此隱私計算技術應運而生。
資料來源:國家工業信息安全發展研究中心發布《中國隱私計算產業發展報告(2020~2021)》
越來越多的企業正把目光投向隱私計算領域,隱私計算技術也已在不同場景中落地。
國外隱私計算代表案例:
谷歌 ——Password Checkup保護數據安全共享
2019 年2 月,谷歌推出密碼檢查器Password Checkup,一個Chrome擴展程序,幫助用戶檢測他們在網站上輸入的用戶名和密碼是否已被盜用。
Password Checkup依賴于隱私集合交集(PSI)的加密協議,協議收集超過“40 億個”的已知不安全或已外泄的賬號和密碼,在Chrome 用戶安裝這功能后,一旦用戶登錄某個網站時,Google 便會主動偵測帳戶密碼是否在外泄名單中。
Password Checkup程序體積小巧,功能簡單,但背后卻對大量數據進行高安全等級處理。本地加密、密文數據對比等可以說是隱私計算基本概念的教科書式展現,也令其成為數據安全共享的典型科普案例。
蘋果——iOS10引入差分隱私技術保護用戶數據
移動互聯網時代,手機承載一個人所有的秘密。
早在2013年一位當時就讀于美國西北大學的研究生,結合搜索引擎與紐約城市出租車和豪華轎車委員會對外公布的一份2013年全市的出租車行程數據,便鎖定幾位明星的行蹤。
但要如何抵御對于個體用戶隱私數據的“精確計算”,而又能提高數據共享和使用的效率?
蘋果公司在當時推出的iOS 10系統中,用差分隱私收集法做出回答。
差分隱私的原理是用算法加擾個人用戶數據,使追蹤技術無法實現回溯。隨后在無法獲得原始數據的情況下對數據批量計算,輸出計算結果。
在獲得機器學習所需的數據資源的同時,實現用戶隱私數據的保護。
目前國外,谷歌、蘋果、facebook等企業都在進一步加強對數據安全的保護力度。
國內也有翼方健數、微眾銀行、螞蟻金服、華控清交這“隱私計算四小龍”領跑行業,呈現出四超多強的局面。
國內隱私計算企業一覽圖:
資料來源:微眾銀行&畢馬威發布《2021隱私計算行業研究報告》
國內隱私計算代表案例(以隱私計算四小龍為例):
翼方健數——廈門市城市級健康醫療大數據開放平臺
在醫療資源總量不足,優質資源匱乏,分布也不夠合理的大環境下,分級診療成為重要的解決方案。
如何將三甲醫院醫生積累的豐富臨床經驗轉化為智能化的知識輸出,并輔助診斷?醫療AI也許是很好的解決方案。
但囿于對數據安全、醫學倫理和個人隱私方面的擔心,數據的獲取、治理以及合理應用仍是醫療AI行業的難題。
翼方健數基于隱私安全計算技術平臺“翼數坊”(XDP),在廈門市衛健委的主導下,匯聚廈門市各醫療機構的健康醫療數據,引入第三方服務機構來處理和挖掘原始數據,提供應用服務。
“翼數坊”首先在廈門全市基層社區醫院兒科診療過程中落地應用,通過學習海量的兒科電子病歷,開發病例結構化、輔助診斷、輔助用藥,輔助檢查推薦等一系列深度學習模型,通過打通智能模型、電子病歷EMR與其他信息系統,形成一套智能臨床輔助決策和知識庫體系。
翼方健數CEO羅震認為,未來,技術甚至支持多個隱私安全計算平臺作為分布式網絡進行交互。完成數據探查、數據價值輸出到數據價值流通,數據價值高地將會真正出現,形成一個“數據和計算的互聯網”(IoDC)。
微眾銀行——聯合多家外部合作伙伴建立小微企業信貸風控模型
近年來,雖說小微貸款越來越受重視,但由于風險過高,許多銀行不愿給小微企業貸款,因此如何規避風險,降低微型企業貸款的不良率顯得尤為重要。
微眾銀行聯合多家外部合作伙伴一起搭建基于聯邦學習的風控模型,以解決小微企業貸款風控數據不足的問題。
在報告中,通過以微眾銀行和發票信息服務公司的合作案例,驗證微眾銀行“基于開源的聯邦學習系統FATE進行縱向聯邦建模,多個機構可以建構聯合模型而無需共享其數據”模式的有效性和安全性。
與只使用傳統模型來訓練標簽Y相比,聯合發票數據的縱向邏輯回歸AUC增加12%,隨著模型效果的改善,貸款不良率明顯下降。
螞蟻金服——螞蟻鏈摩斯多方安全計算平臺
金融企業應用場景各方都有各方的數據系統,并不互用,而且互用方式對隱私信息的保護也需要單獨投入研發,螞蟻鏈服務可解決這一難題。在金融場景下,螞蟻鏈可以解決單一機構數據不足,第三方合規數據不易獲取的困難。
螞蟻鏈摩斯多方安全計算平臺采用去中心分布式架構,數據合作各方通過本地安裝的摩斯計算節點完成安全計算,保證原始數據不出域,僅輸出計算結果。
并可將查詢調用記錄存證在區塊鏈上,防止數據造假,保障數據質量。
例如與富民銀行聯合風控,富民銀行利用摩斯安全計算平臺,和合作方實現多方聯合風控,在保證數據安全的同時,實現模型預測效能提升25%。有效降低業務風險和不良資產率。
華控清交——PrivPy多方計算平臺助力金融機構
金融業作為經營風險的行業,在業務數據化驅動與合規經營的內外部環境要求下,其數據安全共享與融合應用的需求愈加迫切。
金融機構面向個人投資者銷售資管產品時,需要嚴格確認投資者當前持有的金融資產總額或年收入總額等,以核實其是否具有投資資格。
面對上述問題,華控清交在中國互聯網金融協會指導下,使用多方安全計算技術,實現了在保護申請者數據隱私的前提下,融合各機構客戶金融資產、收入流水等數據,自動計算投資者的金融資產或收入狀況信息,實現高效合規的個人合格投資者認證,同時全流程可驗證、可追溯、可解釋、可審計、可監管。
在大數據與人工智能時代背景下,AI與數據計算在各行各業應用越廣泛,數據價值就愈加凸顯。
隱私計算看似是個全新的概念,其實是個世界級的話題。隱私計算最早源于人工智能的興起,直到今天隨著數據的價值日益彰顯。
近年來,資本市場對該領域的關注度愈漸火熱,2020年-2021年隱私計算賽道融資事件也呈現幾何式增長狀態。2021年7月底,隱私計算領域技術專精型公司中已披露的最大規模單筆融資由國內“隱私計算四小龍”之一的翼方健數宣布完成,總金額超過3億元人民幣。隱私計算企業獲得來自資本的認可,無疑也肯定了隱私計算將在未來發揮巨大的潛力。