今年年中,加州伯克利大學的研究者希望獲取新冠病毒的感染者行為數據,來分析追蹤新冠病毒的傳播情況,考慮到數據隱私問題,他們把目光投向了同態加密技術。由于全同態加密在無需解密的情況下即可對密文進行任意計算,在保護數據隱私的基礎上充分發揮數據的價值,全同態加密一直被譽為密碼學的“圣杯”。
最近,阿里安全對全同態加密功能進行了重要擴展,擴展后的加密計算速度比當前最好的同態加密計算方法快64倍,密鑰體積卻小2個數量級。原本需要等待數小時的加密計算,現在幾分鐘就可完成。阿里安全闡述該研究的論文《Pegasus(飛馬):同態密碼上的多項式與非多項式計算》入選世界信息安全領域四大頂級會議之首的IEEE Symposium on Security and Privacy (S&P),這也是中國工業界在S&P頂會上首次實現了第一作者論文的突破。
全同態加密計算轉換有障礙
正如加州伯克利大學的研究者希望能在充分保障新冠病毒感染者的數據隱私,又想發揮數據的最大效用,分析獲取新冠病毒的傳播情況,對抗目前人類面臨的嚴峻考驗,挽救更多生命。數字經濟時代,如何發揮保護數據隱私,同時發揮數據的價值,是一個難題。
其中一個解法是,假設數據擁有者甲需要和數據擁有者乙進行合作,乙可以對自己的數據使用全同態加密再發送給甲,讓甲在不觸及乙的原始數據內容前提下完成計算,這樣就能保護乙的數據安全,真正實現“數據可用不可見”。
不過,全同態加密在應用上還面臨許多障礙。目前大部分全同態加密算法(A類)只支持加法及乘法等多項式計算,而難以有效支持除法、根號等非多項式計算;少部分(B類)同態加密算法可以支持任意計算,但是其性能顯著低于A類。
圖示:A、B兩類全同態加密技術優劣勢比較
這就好比兩個加密“工具”各有優劣,卻沒有集合兩方“長處”的工具,在實際加密應用中,又需要能同時發揮兩種長處的“工具”。
“實際應用同時包含多項式計算和非多項式計算,這些問題很難使用單一的全同態加密妥善解決。”阿里安全雙子座實驗室高級算法工程師居侯介紹。
居侯的主要研究方向是同態加密與隱私保護計算,他于2019年加入阿里安全雙子座實驗室。與大眾印象中的密碼學研究者都是進行理論研究不同,居侯在密碼學應用領域也投入了很多精力,他還為多個知名開源全同態加密算法庫(如HElib、SEAL)貢獻了源碼。
阿里飛馬方案可自由切換加密模式
最近,居侯和同事們提出了一個能夠發揮兩類技術長處的方案,幫助全同態加密技術大大提升了運行速度,并降低了運算成本。
阿里安全雙子座實驗室提出的這種全同態密文技術“Pegasus(飛馬)方案”,是可以高效橋接A類和B類全同態密文技術的全新轉換方案。
在飛馬方案中,研究者可以在需要做多項式計算時使用A類方案(馬形態),而在需要做非多項式計算時切換到B類方案(飛行形態),能巧妙解決這個兩難問題。
“也就是說,假如要翻越一座高山,原來的方案是靠馬翻山越嶺,在飛馬方案下,我們直接讓馬飛過高山,到山那頭的平地時,又能切換成奔跑的馬的狀態。Pegasus(飛馬)可以依據環境自動選擇最優的技術方案,兩種方案切換無障礙。”居侯比喻。
圖示:阿里安全研究的“飛馬方案”可以在需要做多項式計算時使用A類方案(馬形態),而在需要做非多項式計算時切換到B類方案(飛行形態)。
正是由于“飛馬”直接飛過了“高山”,全同態加密的速度大大提升。以機器學習中常用的操作sigmoid為例,Pegasus的計算速度比此前最好的工作(CHIMERA)快64倍。
“Pegasus(飛馬)方案”不僅給全同態加密技術提速。它還將密鑰體積減小了2個數量級,可減少公鑰傳輸成本和計算的成本,如內存和硬盤的使用等。
阿里安全雙子座實驗室資深安全專家洪澄解釋,此前密鑰需要占據100G左右的內存,現在只要1G。普通電腦的內存是8G左右,手機內存是1G左右,以前需要使用高性能服務器進行計算,在“飛馬”的技術方案下,完全可以使用普通電腦,甚至手機進行全同態加密的密鑰傳輸、儲存以及加密計算。
當前隱私保護計算技術已經逐漸開始獲得認可,業界也誕生了多個相關的試點應用。但是由于其底層密碼學技術性能和功能的局限性,這些應用往往集中于一些簡單的應用場景,很難擴展到更大更復雜的業務范圍。
也因此,“Pegasus(飛馬)方案”這一突破在解決同態加密技術局限性的問題上前進了一大步,拓寬了各類隱私保護計算技術的潛在應用場景,加速了技術應用,更讓從源頭守護數字經濟下大數據的應用安全多了一份技術保障。
洪澄闡述了“Pegasus(飛馬)方案”誕生的原因:“在阿里新一代安全架構核心理念中,我們注重從基礎能力開始打造穩定、可靠的安全技術,而密碼學的安全性具備堅實的數學理論基礎保障,是安全技術體系的重要基石之一。”
從源頭“密碼學”的安全、穩定性上著力,最終還是為了構建更安全和高效的應用,促進數字經濟的發展。居侯希望,眼下“Pegasus(飛馬)方案”的提出,可促進不同商業體之間的數據聯合建模,比如銀行和電商可以在保護各方數據的前提下,建立合適的數學模型,提高風控模型的能力,使每一筆交易更安全。