伴隨人工智能技術對產業智能化升級進程的推動作用不斷加深,AI模型的安全防護與隱私保護問題也日漸成為業內關注的焦點。
9月26日,百度安全正式對外發布了基于百度飛槳開源深度學習平臺的安全與隱私工具PaddleSleeve。以場景為驅動,覆蓋現實風險,支持產業級模型,為企業和開發者打造更為貼近實踐應用的模型安全強化選項,開啟AI模型安全與隱私的新探索。
在同日舉行的2021 CCS成都網絡安全大會AI安全專題論壇上,百度安全部主任架構師包沉浮詳細講解了PaddleSleeve的主要功能和關鍵能力。
百度安全部主任架構師包沉浮在2021 CCS成都網絡安全大會發布PaddleSleeve
眾所周知,作為AI安全最為底層的保障環節之一,AI模型安全正面臨著多維和緊迫的安全挑戰。根據對目前已知攻擊行為的分析,攻擊者可通過數據投毒、模型后門等方式,在訓練及預備部署階段即生成有缺陷的AI模型;而利用模型魯棒性自身存在的問題或借助模型竊取、數據提取等手段,其也能夠在部署階段非法獲取模型和隱私數據。
為此,包括Google Tensorflow、Facebook Pytorch在內的不少國內外主流深度學習平臺先后推出了相關安全工具,嘗試為上述一系列問題的解決提供研究支撐。依托百度飛槳,百度安全的PaddleSleeve則旨在提供一個不止于學術研究、更適應于產業實踐的安全工具。以場景驅動、現實風險、產業級模型為三大核心理念,為有高安全性、高隱私性需求的場景提供端到端的安全技術支撐,并全面覆蓋AI模型所需應對的從Security到Safety再到Privacy的各個層面的安全挑戰。
具體而言,PaddleSleeve可為企業和開發者帶來兩個層面的實用功能:
其一,在模型攻擊與評估層面,PaddleSleeve融合了百度安全Advbox對抗樣本攻擊及Robustness魯棒性評估等諸多能力,并新增了對飛槳2.X版本的支持,引入了更多前沿攻擊算法和模型集成遷移攻擊策略。同時,聚焦于隱私性,PaddleSleeve也能夠支持AUC、Recall、結構相似度、峰值信噪比(Peak SNR)等隱私攻擊效果評估指標,并可實現對模型數據被還原風險及模型是否存在關鍵信息泄露風險的檢測。
其二,在模型防御層面,PaddleSleeve支持多個業界前沿、性能良好的對抗訓練方法,企業和開發者可通過新訓練、模型精調等方式進行對抗訓練,并可借助多種過濾算法在不修改模型的情況下實現非侵入式的對抗魯棒性增強。而基于差分隱私擾動、梯度壓縮等方法的隱私增強優化器,其也可幫助企業和開發者更為便捷地訓練出可有效抵御常見隱私竊取攻擊的模型。
目前,PaddleSleeve已在多個場景中實現對飛槳自定義及預訓練模型,ResNet、YOLO等通用產業級模型的支持。而伴隨一系列新功能的不斷加入,百度安全也希望與學術界、產業界持續展開合作,以場景為驅動,面向產業實踐,為AI模型安全與隱私保護提供更好的能力支撐。
秉承“有AI,更安全”的使命,百度安全始終致力于攜手多方力量共同推動AI安全開放生態的建設。作為一個開源項目,百度安全也歡迎企業和開發者的加入,一起推動PaddleSleeve功能的完善與拓展。