一、安全大數據
網際空間安全面臨的威脅越來越多樣化。移動網絡、云和虛擬化、物 聯網、工控系統等技術領域的快速發展,使得保護對象和攻擊路徑都變得 更加復雜。而攻擊來源也從早期的個人黑客變為犯罪團伙、政治勢力、網 絡部隊等更嚴密的組織。甚至大數據技術本身也被攻擊者所利用。能夠應 對核威懾的,只有核威懾本身;能夠應對大數據攻擊技術的,也只有大數據安全技術。目前安全行業的大數據應用場景主要包括:網絡安全態勢感知、高級持續威脅檢測、偽基站發現與追蹤、反釣魚攻擊。
1、網絡安全態勢感知。近年來,網絡安全事件層出不窮,傳統安全防御措施很難及時、有效的發現安全威脅。這就需要依靠互聯網的海量安全數據,解決網絡安全監控的問題,通過大數據技術對這些安全要素信息進行分析,全面、精準的掌握網絡安全狀態,并以可視化的方式,向網絡安全監管單位提供所屬管轄范圍內的實時感知,同時針對安全隱患提供通報等手段幫助監管單位完 成安全監控的閉環,從而改變當前“黑客主動攻擊、企業被動防御”的局面。
態勢感知技術這一概念源于美國空軍的研究,此后在核反應控制、 空中交通監管及醫療應急調度等領域被廣泛應用。在安全領域,該技術是指廣泛采集和收集廣域網中的安全狀態和事件信息,并加以處理、分析和展現,從而明確當前網絡的總體安全狀況,為大范圍的預警和響應提供決 策支持的技術。態勢感知技術主要是應對大范圍廣譜威脅,相關的技術包 大數據安全標準化 38 括海量異構數據分析、深度學習、網絡綜合度量指標、網絡測繪、威脅情 報、知識圖譜、安全可視化等。
2、高級持續威脅檢測。高級持續性威脅具有精心偽裝、定點攻擊、長期潛伏、持續滲透等特 點,已經成為網絡犯罪和間諜活動的首選攻擊方式。過去針對特定網絡APT 定向攻擊的發現有兩個難點:一是未知威脅分析過程缺少對歷史數據的支 持,難以進行回溯關聯,遺漏了很多關鍵信息;二是缺少外部情報的來源, 只依賴于自有的黑域名/黑IP庫,檢測的精度和效率都難以滿足需求。
采用大數據技術,從兩方面搜集數據:一是來自于互聯網威脅情報 云平臺的威脅情報數據,二是來自于本地運營商互聯網出口監控到的網絡 流量數據。基于上述的海量安全數據,可以通過人工智能結合大數據知識以及攻擊者的多個維度特征還原出攻擊者的全貌,包括程序形態,不同編 碼風格和不同攻擊原理的同源木馬程序,惡意服務器等,通過全貌特征跟蹤攻擊者,持續地發現未知威脅。
通過對云端大數據中提取的惡意域名、IP、主防庫、樣本庫等信息進行關聯分析,發現傳統規則檢測手段無法發 現的未知威脅,實現攻擊早期的快速發現。根據樣本外連行為識別免殺木 馬,實現早期的快速發現。對未知威脅的網絡行為,攻擊源頭進行精準定 位,對遠控木馬等行為進行威脅的識別,最終達到對入侵途徑及攻擊者背 景的研判與溯源。
3、偽基站發現與追蹤。偽基站是一種小型或微型的信號收發裝置,和運營商的真實基站類似,能夠獲取周圍的手機與基站的設備信息,通過模擬真實基站通信機制,迫使周圍的手機連接到該仿冒的基站上,向普通用戶發送垃圾短信, 甚至冒用號碼,群發詐騙信息。 采用大數據技術,則可以極大提高發現偽基站的能力和效率,并可以及時阻斷詐騙短信中的釣魚鏈接,打破詐騙鏈條。具體包括以下步驟:第 白皮書 (2017)一,通過手機用戶舉報垃圾短信,或者通過手機專業軟件主動攔截并上報 垃圾短信,大量收集偽基站短信中包含的時間、地點、內容、仿冒的基站 號等各種信息。
第二,在大數據處理平臺中,運用自然語言處理與機器學習的方法,去掉大量的噪聲點,從海量的垃圾短信中以較高的精度識別出 偽基站短信;第三,將偽基站短信與經緯度信息結合,就可以發現并定位偽基站;結合偽基站的歷史數據,可以進一步找到偽基站的活動規律,并以此對其運動軌跡進行預判;第四,與地理信息系統聯動,展現偽基站位置、偽基站的行為、歷史運行路徑、數量分布等等信息,從而幫助執法部 門的抓捕活動。
4、反釣魚攻擊。 釣魚攻擊是一種利用社會工程學手段,偽裝在線金融或交易平臺的 網站,針對客戶個人身份數據和金融賬號進行盜竊的犯罪行為。近些年來,釣魚攻擊相關的網銀欺詐案件使得用戶蒙受巨大的經濟損失,也嚴重影響了銀行業金融機構的聲譽。發現釣魚網站,需要利用搜索引擎掃描相關互聯網址,并通過大數據建模過濾掉可信頁面與重復頁面,篩選出有嫌疑的釣魚網址頁面,將這 些頁面輸入到分析引擎中;用戶也可以進行舉報,將釣魚網址上報到分析 引擎的數據庫中。
分析引擎通過規則模型綜合研判、機器學習等方式檢測 出釣魚網址和頁面。將發現的釣魚網站和網頁匯集成為網址信譽庫,金融 機構可以把具有欺詐性的URL信息提到這個信譽庫中,其中的信息就是是否攔截網頁訪問的依據。各終端訪問釣魚網站時,通過與云關聯的終端軟 件,提示并阻止用戶的訪問行為。
二、電子政務大數據
各政務部門在開展業務的過程中積累了大量數據,通過對政務大數據進行開發、利用、挖掘,能夠為政府提供智能辦公、智能監管、智能服務、智能決策等大數據服務,提高政府辦公、監管、服務、決策的智能化水平,推動社會治理體系和治理能力現代化。通過將各級政務部門數據資源的匯集,實現政務數據的融合互通,并對大量的多源異構數據融合進行大數據綜合分析、挖掘,幫助政府將現有的數據資源轉化創造價值,能夠實現政務大數據在城市規劃、建設、管理等方面的綜合應用。
電子政務大數據面臨的安全風險和挑戰主要包括:
1、平臺安全。大數據平臺是政府使用數據資源的基礎平臺,平臺安全是保障政府安 全可靠利用數據資源的基礎。大數據平臺除了面臨傳統的惡意代碼、攻擊軟件套件、物理損壞與丟失等安全威脅外,由于自身架構要根據政府業務需求和安全要求變化不斷改進,因而產生傳統的身份認證、數據加密手段 適用性問題。
2、 服務安全。構建基于互聯網的一體化公共服務平臺,面向公眾提供基于大數據的 便民服務,是落實國家推進國家治理體系和治理能力現代化、建設服務型政府要求的重要任務。基于互聯網建設的政務在線服務窗口,是政務大數 據為社會公眾服務的重要組成部分,便捷的互聯網應用環境下,在提質增優公共服務的同時也為便民服務帶來嚴峻的安全挑戰,需要應對基于 Web 的攻擊、Web 應用程序攻擊/注入攻擊、拒絕服務攻擊、網絡釣魚、用戶 身份盜竊等威脅,抵御信息泄露、網絡癱瘓、服務中斷等安全風險。
3、數據安全。各部門在開展業務和對政務大數據進行開發利用的同時,數據自身安 全非常重要,涉及數據生命周期各階段相關的數據采集、數據傳輸、數據 存儲、數據處理、數據交換、數據銷毀等活動。政府部門數據公開、行業 間以及行業內部數據平臺化共享時的數據安全,是迫切需要解決的問題, 是大數據資源實現開放共享、相關“數據掘金”應用得以發展的關鍵。
4、數據確權問題。政務數據的所有權、使用權、管理權涉及多個部門,特別是政府授權 社會資本方搭建的公共服務系統所產生的數據,涉及個人隱私、國家經濟命脈,在進行大數據分析中,必須做到權責分明,厘清數據權屬關系,防 止數據流通過程中的非法使用,保障數據安全流通。但是,目前數據權屬仍缺乏法律支撐,數據使用尤其跨境流動所產生的安全風險日益凸顯。
5、APT攻擊防御。 APT是黑客針對客戶所發動的網絡攻擊和侵襲行為,是一種蓄謀已久 的“惡意網絡間諜威脅”。這種行為往往經過長期的經營與策劃,并具備高度的隱蔽性。APT攻擊以竊取核心資料為目的,對政府部門大數據應用產生重大安全威脅,因此必須在政務大數據中高度防范此類攻擊。
三、健康醫療大數據
作為典型的實踐科學,醫學中有很多知識來源于經驗積累。而目前經 驗積累的最直接、客觀的體現就是“數據”。因此,利用健康醫療過程中 產生的海量數據,開發其潛在價值,使其助力健康醫療事業的發展,成為醫療行業、技術研發領域等相關有識之士共同努力的目標。
健康醫療大數據在促進業務發展的同時,面臨的安全挑戰主要表現在:
1、數據權屬不清。健康醫療大數據起源于個人患者本身,那么數據 權屬到底是屬于個人、還是產生數據的醫療機構一直沒有定論;另外,第三方機構在原始數據基礎上挖掘延伸出的新數據,其歸屬權也沒有明確規定。
2、應用復雜性高。目前各地區和機構在進行健康醫療領域信息化建 設時大都根據自身需求建立獨立的信息系統,這些信息系統架構各異、數 據格式不同,導致數據在安全共享、交換和處理時的復雜度大幅提升。
3、個人隱私保護難。健康醫療數據中包含特別敏感的個人隱私信息,必須依法進行管控和保護;對涉及健康醫療數據的管理要以相應的法 律法規做指導,在進行健康醫療數據的收集、存儲、挖掘等應用時,需要解決個人隱私保護的難題。
四、電商行業大數據
電商行業作為基于互聯網技術衍生的新型業務,積累了大量商家數據、買家數據、商品數據,以及在買賣交易過程中產生的訂單數據、交易數據和用戶行為數據等。借助大數據技術發展契機,電商行業也開始了大數據時代的轉型。電商行業基于長期積累的海量數據,開始在不同業務方向利用大數據技術分析、挖掘數據價值。
電商行業大數據在促進業務發展的同時,相應的安全挑戰也隨之浮現,主要表現在:
1、數據權屬不清。電商業務的開展主要包括電商平臺、商家和消費者三方,電商業務產 生的數據如何劃分其所有權、控制權和使用權,是在電商業務中合理使用數據的前提。當前電商業務的大數據應用中,通常利用電商平臺對數據進行分析,也存在商家或商家授權獨立軟件提供商使用商家數據進行分析的大數據安全標準化46 情況,在權利歸屬不明確的情況下,責任的歸屬也難以界定,相關數據安全難以保障。
2、大數據聚合分析風險。電商業務的大數據應用涉及對消費者相關的數據分析,雖然可以通過 隱私保護政策、用戶授權協議的形式獲取相關數據的使用合法授權,而且 在對電商業務分析的過程中也會采用匿名化處理的方式,保證用戶的個人信息安全。但是,在對大數據加工計算的過程中,如何保障不會因為大數 據的聚合分析而實現“去匿名化”,依然是亟待解決的難題。
3、數據版權保護。電商生態圈內的數據流動和共享較為普遍,目前主要通過法律協議方式約束對數據的使用。但由于缺乏有效的數據版權保護技術手段及措施, 難以甄別是否存在超出范圍的數據擴散或使用問題。
4、數據跨境安全。目前國家大力支持跨境電商業務,而跨境電商業務必然涉及數據的 跨境問題。不同國家和地區的數據保護法規對數據跨境流動的要求存在差異性,比如俄羅斯明確提出俄羅斯公民的數據應在俄羅斯境內更新后方可傳到海外進行處理;歐盟則擴大了數據保護法律適用的管轄范圍。這些法規將給跨境電商企業帶來高昂的合規成本,制約了跨境電子商務的發展。 如何處理數據跨境安全合規與跨境電商戰略發展的矛盾,是亟待解決的難題。
五、電信行業大數據
電信運營商擁有大量的數據資源,如網絡信息、用戶終端信息、用戶 位置信息等,同時電信行業近年來利用大數據進行深度挖掘分析,將豐富的網絡、用戶等數據資源加工抽取后封裝為服務,向客戶提供。可拓展的大數據應用服務主要為內部支撐、社會服務、商業運營等幾大類。
大數據給電信行業帶來新的發展機遇,電信運營商借助已有的數據積累優勢,不斷發展大數據應用,但同時數據的集中管理、數據對外開放等新技術特點和業務新形態應用,也使電信行業大數據面臨新的安全風險和挑戰,主要包括:
1、供應鏈安全。通信數據在移動網絡設備中產生,而這些設備是由多家供應商提供。 大數據安全標準化 48 同時,存在大數據平臺系統第三方供給代建設、代維護等問題,在特定階 段,部分設備的操作權在供應商手中,這意味著供應鏈的各環節存在安全風險。
2、數據集中管理。在大數據業務應用發展的驅動下,電信運營商的數據由原來的各系統 分散存儲轉變為大數據平臺集中存儲模式,大數據資源的安全風險更加集 中,一旦發生安全事件將涉及海量客戶信息及公司數據資產。
3、平臺組件開源。大數據平臺多使用開源軟件,這些軟件設計初衷主要考慮高效數據處 理,缺乏安全性保障,滯后于電信業務發展的安全防護能力,存在安全隱患。
4、敏感數據共享。在電信運營商內部信息系統建設相對分散,敏感數據跨部門、跨系統 共享留存比較常見,其中一旦存在系統安全防護措施不當,均可能發生敏 感數據泄漏,造成“一點突破、全網皆失”的嚴重后果。