摘要 :近日,由微眾銀行人工智能首席科學家范力欣博士,馬來亞大學陳志勝教授,加拿大工程院及加拿大皇家科學院兩院院士、微眾銀行首席人工智能官楊強教授聯合業內多位專家學者共同編寫的,關于利用數字水印技術驗證機器學習模型所有權的論文合集《機器學習模型數字水印》正式出版。
正文:
6月30日,國家知識產權局發布《二〇二二年中國知識產權保護狀況》白皮書顯示,中國政府不斷強化知識產權全鏈條保護,筑牢知識產權領域安全屏障。隨著人工智能的發展,機器學習模型在各個行業、各個領域中發揮著越來越重要的作用,特別是大型預訓練深度學習模型,其經濟價值日益凸顯,模型的知識產權保護問題也越來越受到關注。一方面,訓練性能優越的模型成本高昂,需要大規模數據集、龐大的計算資源和設計者的智慧,模型產權保護涉及數據提供者和模型開發者的直接利益。另一方面,模型知識產權保護對于激勵創新、促進技術轉移和合作起著至關重要的作用,關乎整個產業的公平、健康發展。在此背景下,結合行業專家的研究成果與法律政策要求,以技術手段解決時代難題,將助推當前大模型時代下模型知識產權保護領域的發展。
近日,由微眾銀行人工智能首席科學家范力欣博士,馬來亞大學陳志勝教授,加拿大工程院及加拿大皇家科學院兩院院士、微眾銀行首席人工智能官楊強教授聯合業內多位專家學者共同編寫的,關于利用數字水印技術驗證機器學習模型所有權的論文合集《機器學習模型數字水印》正式出版。
圖:書籍封面
書中提出了一系列模型水印方法,將水印植入到目標模型中以便在模型被竊取時,模型所有者可以提取預定義的水印來聲明所有權。模型水印方法采用后門訓練、多任務學習、決策邊界分析等常用技術來生成構成模型水印或僅為模型所有者所知的指紋的秘密條件。這些方法對模型性能幾乎沒有影響,這使得它們適用于各種情況。就魯棒性而言,植入水印必須能夠抵御各種試圖刪除水印的對抗性攻擊。模型水印方法的有效性體現在圖像分類、圖像生成、圖像描述、自然語言處理和強化學習等多種應用中,有助于破解人工智能模型產權保護的難題。
本書的主要編者之一,微眾銀行人工智能首席科學家范力欣博士表示:“本書由一群活躍在機器學習、數據和模型管理、聯邦學習等技術前沿應用領域的研究者共同完成,匯聚了大家在人工智能領域的最新研究成果。書中涵蓋了使用水印保護機器學習模型的動機、基本原理、技術和協議。此外,還展示了模型水印、簽名和護照嵌入等方面的前沿工作,以及它們在分布式聯邦學習環境中的使用案例。”
圖:章節目錄
行業相關專家對書中的相關技術與應用給予了高度評價。觀韜中茂律師事務所合伙人、中國首席數據官聯盟專家組成員王渝偉指出,“數字水印技術在傳統知識產權保護領域有較廣泛的應用,但就該技術在模型產權保護中的應用及其價值的討論和研究還是一個很新的話題。與其他技術手段相比,數字水印技術所具有的唯一性、與加密相結合、難以偽造以及成本效益高等優點,讓我們相信該技術可以成為模型產權保護中的重要技術手段和法律證據來源。但考慮到模型具有軟件、算法和數據的特征,難以納入現有的知識產權類別,這也使得依靠現有知識產權法律難以提供全面保護。更優的方式是將數字水印等技術與明確的法律法規相結合,探索的多層次的模型產權保護機制,以發揮數字水印等技術的最大作用。這些都是未來人工智能立法需要統籌考慮的,同時也是留給關注該領域技術與應用的本書讀者們可以持續思考的問題。”