導語:知識和數據被視為驅動人工智能邁向3.0時代的重要要素。如何把分散在不同的行業或領域里的數據和知識,充分地利用起來?同盾科技人工智能研究院創造性地提出了數據安全交換(FLEX)協議,該協議約定了聯邦過程中參與方之間數據交換順序,以及在交換前后采用的數據加解密方法。其中包含一系列的約定,只要遵守這些約定,參與方就可以安全地加入到聯邦中,無需擔心數據隱私會有泄漏風險,全面實現數據可用不可見,為人工智能3.0時代奠定重要的基礎。
AI3.0的輪廓已依稀可見
同盾科技合伙人、人工智能研究院院長李曉林教授以歷史的眼光把人工智能的發展分為三個階段,他認為大約每隔30年,人工智能將會迎來一次革命性躍遷。當下,我們正處在人工智能2.0時代。
人類學習依靠人的大腦,是小數據學習的模式,而人工智能的機器學習、聯邦學習都離不開大數據。算法、算力和數據被普遍視為人工智能發展的三要素。人工智能2.0時代,大數據是人工智能發揮重要作用的引擎,但目前數據智能所面臨的挑戰也近在眼前,數據孤島、數據安全交換等成為制約AI技術應用的瓶頸,也是AI始終無法突破超越人類智能的那個“奇點”。
我們是否會被困在人工智能2.0時代,何時將迎來3.0時代?李曉林教授認為,當人工智能步入3.0時代,除數據、算力、算法三要素之外,知識要素將成為第四要素。基于新的四要素,AI3.0會建立一個全面反映人類智能的、可解釋、可因果推測、可共享的泛在生態,優化用小數據和點滴知識去實現全面認知和推理的能力,并且能夠做出更加復雜、自主化的智能決策。
如何把分散在不同的行業或領域里的知識,充分地利用起來?同盾人工智能研究院知識聯邦技術體系中的數據安全交換協議應運而生。
或將改變游戲規則 數據安全交換協議是什么?
我們知道,以萬維網和HTTP協議的出現為標志,信息革命被迅速引爆,與其說是一種技術,倒不如說它是對信息的存儲和獲取進行組織的一種思維方式。
數據安全交換協議同樣是一種組織和思維方面的革命,不同的是,這是發生在人工智能領域。
聯邦表面上看只是將不同的參與方連接起來,作為一個整體共同參與聯邦應用,但實際上它并不是簡單地連接和通信。除了連通之外,聯邦還要保證在交互過程中不會泄漏參與方的數據隱私。所以,聯邦的本質是多個參與方之間的數據在時空中的安全交換,并由此產生價值在時空中的實現和交換。
目前為止還沒有一種數據安全交換標準形成,能讓各方確保數據交換過程的安全性是有保障的,進而愿意加入到聯邦中。一旦參與機構(數據提供者)足夠多,聯邦規模足夠大,數據多樣性就有保障,也就會有更多機構(數據使用者)愿意來使用聯邦服務,也會有更多科技型機構(模型和應用開發者)來提供豐富的算法、模型和應用。
從圖中展現的聯邦生態構建過程可知,數據安全交換是整個聯邦生態的核心。為了保證聯邦生態的順利建設和良性發展,業界亟需一套統一的數據安全交換標準,支持各種聯邦應用落地。
基于此,同盾科技人工智能研究院提出了聯邦數據安全交換(Federated Learning EXchange,FLEX)協議。FLEX協議約定了聯邦過程中參與方之間數據交換順序,以及在交換前后采用的數據加解密方法。只要參與各方能夠遵守這些約定,就可以安全地加入到聯邦中提供數據或使用聯邦服務,無需擔心數據隱私會有泄漏風險。
FLEX協議實際上包括兩層: 1) 應用協議:這一層協議是面向聯邦算法的,為聯邦算法提供多方數據交換的應用支撐。協議中會約定多方間數據交換的順序和采用的具體密碼算法。聯邦過程中采用的通信協議也會被封裝在這里。 2) 公共組件:是上層應用協議所依賴的基礎密碼算法和安全協議,比如同態加密、秘密分享等。
FLEX協議封裝了數據安全交換的實現,共提供了5大類17個協議,并定義了與聯邦算法相關步驟的接口,也就是參數的輸入和輸出。至于聯邦算法中的其它非相關步驟,FLEX是不關心的。而聯邦算法在執行中只在需要多方數據安全交換時才調用FLEX協議,提供輸入參數并接收輸出結果,無需關心FLEX內部是如何加解密和通信的,更不需要關心其它參與方是誰、其它數據存儲在哪里等問題。
知識聯邦重塑數據生產關系
未來的社會,數據是生產資料,人工智能是生產力, 知識聯邦是生產關系。 目前,數據作為生產要素驅動了人工智能的發展,人工智能的突破是生產力的突破,它提供了一種提升效率的方法。而知識聯邦則是一種新型生產關系,它能夠改變我們使用數據的方式,實現數據等生產資料在時間和空間上的價值轉換和交易。
聯邦尤其適用于開展跨機構的數據資產協作,有助于促進不同主體之間的數據共享和優化業務流程。基于聯邦技術,做大數據分析就不需要再收集獲取數據,而是直接使用數據即可,數據所有權不會發生變化。數據的擁有者真正實現對數據的所有,最大化數據在多種場景下的多次價值實現,其它機構都是按照聯邦協議使用數據。與過去相比,數據資源的所有權變了,相當于生產關系中的一個重要要素也就改變了。
聯邦提供了一種數據安全的分布式計算環境,使數據不用集中到一家機構,也能實現智能計算和分析,降低數據共享阻力和合規風險。可以說,聯邦的應用有望扭轉當下數據日益集中化的趨勢,避免中心化壟斷,重新平衡各方利益。也會進一步推動數字經濟向開放共享的方向發展,從而徹底重塑數據的“生產關系”,開創數字經濟時代的新模式。