Docker是目前最具代表性的容器技術之一,對云計算及虛擬化技術產生了顛覆性的影響。本文對Docker容器在應用中可能面臨的安全問題和風險進行了研究,并將Docker容器應用環境中的安全機制與相關解決方案分為容器虛擬化安全、容器安全管理、容器網絡安全三部分進行分析。
從虛擬化安全到容器安全
傳統虛擬化技術
虛擬化技術是實現硬件基礎設施資源的充分利用、合理分配和有效調度的重要技術手段。例如,在基于OpenStack的典型IaaS服務中,云服務提供商可通過搭建設備集群建立資源池,并將服務器、存儲和網絡等底層資源進行彈性虛擬化提供給租戶。
傳統虛擬化技術以虛擬機為管理單元,各虛擬機擁有獨立的操作系統內核,不共用宿主機的軟件系統資源,因此具有良好的隔離性,適用于云計算環境中的多租戶場景。
容器技術
容器技術可以看作一種輕量級的虛擬化方式,將應用與必要的執行環境打包成容器鏡像,使得應用程序可以直接在宿主機(物理機或虛擬機)中相對獨立地運行。容器技術在操作系統層進行虛擬化,可在宿主機內核上運行多個虛擬化環境。相比于傳統的應用測試與部署,容器的部署無需預先考慮應用的運行環境兼容性問題;相比于傳統虛擬機,容器無需獨立的操作系統內核就可在宿主機中運行,實現了更高的運行效率與資源利用率。
Docker是目前最具代表性的容器平臺之一,它模糊了傳統的IaaS和PaaS的邊界,具有持續部署與測試、跨云平臺支持等優點。在基于Kubernetes等容器編排工具實現的容器云環境中,通過對跨主機集群資源的調度,容器云可提供資源共享與隔離、容器編排與部署、應用支撐等功能。
Docker容器技術以宿主機中的容器為管理單元,但各容器共用宿主機內核資源,分別通過linux系統的Namespaces和CGroups機制實現資源的隔離與限制。
Namespaces
為了保證容器進程之間的資源隔離,避免相互影響和干擾,Linux內核的Namespaces(命名空間)機制提供了UTS、User、Mount、Network、PID、IPC等命名空間實現了主機名、用戶權限、文件系統、網絡、進程號、進程間通信等六項資源隔離功能。通過調用clone函數并傳入相應的系統調用參數創建容器進程,可實現對應資源內容的隔離,具體情況如表1所示。
命名空間 | 系統調用參數 | 隔離內容 | Linux內核版本 |
---|---|---|---|
UTS | CLONE_NEWUTS | 主機名和域名 | 2.6.19 |
IPC | CLONE_NEWIPC | 信號量、信息隊列和共享內存 | 2.6.19 |
PID | CLONE_NEWPID | 進程編號 | 2.6.24 |
Network | CLONE_NEWNET | 網絡設備、網絡棧、端口等 | 2.6.29 |
Mount | CLONE_NEWNS | 掛載點(文件系統) | 2.4.19 |
User | CLONE_NEWUSER | 用戶和用戶組 | 3.8 |
表1:Namespaces隔離機制
對于某個進程而言,可通過查看/proc/[PID]/ns文件,獲取該進程下的命名空間隔離情況,如圖1所示。其中,每一項命名空間都擁有一個編號對其進行唯一標識,如果宿主機中兩個進程指向的命名空間編號相同,則表示他們同在一個命名空間之下。
圖1:進程命名空間
CGroups
CGroups(Control Groups,控制組)機制最早于2006年由google提出,目前是Linux內核的一種機制,可以實現對任務組(進程組或線程組)使用的物理資源(CPU、內存、I/O等)進行限制和記錄,通過多種度量標準為各個容器相對公平地分配資源,以防止資源濫用的情況。
在實際應用中,CGroups會為每個執行任務創建一個鉤子,在任務執行的過程中涉及到資源分配使用時,就會觸發鉤子上的函數并對相應的資源進行檢測,從而對資源進行限制和優先級分配。
CGroups提供了資源限制(Resource Limitation)、優先級分配(Prioritization)、資源統計(Accounting)、任務控制(Control)四個功能,包含blkio、cpu、cpuacct、cpuset、devices、freezer、memory、perf_event、net_cls、net_prio、ns、hugetlb等子系統,每種子系統獨立地控制一種資源,可分別實現塊設備輸入/輸出限制、CPU使用控制、生成CPU資源使用情況報告、內存使用量限制等功能。幾個主要子系統的具體功能如表2所示。
子系統 | 功能 |
---|---|
blkio | 為塊設備(如磁盤、固態硬盤等物理驅動設備)設定輸入/輸出限制 |
cpu | 通過調度程序控制任務對CPU的使用 |
cpuacct | 生成任務對CPU資源使用情況的報告 |
cpuset | 為任務分配獨立的CPU和內存 |
devices | 開啟或關閉任務對設備的訪問 |
freezer | 掛起或恢復任務 |
memory | 設定任務對內存的使用量限制,生成任務對內存資源使用情況的報告 |
表2:CGroups子系統
安全性
傳統虛擬化技術與Docker容器技術在運行時的安全性差異主要體現在隔離性方面,包括進程隔離、文件系統隔離、設備隔離、進程間通信隔離、網絡隔離、資源限制等。
在Docker容器環境中,由于各容器共享操作系統內核,而容器僅為運行在宿主機上的若干進程,其安全性特別是隔離性與傳統虛擬機相比在理論上與實際上都存在一定的差距。
Docker容器安全風險分析
根據Docker容器的主要特點及其在安全應用中的實際問題,本文將Docker容器技術應用中可能存在的技術性安全風險分為鏡像安全風險、容器虛擬化安全風險、網絡安全風險等類型進行具體分析,如圖2所示。
圖2:容器安全風險分類
鏡像安全風險
Docker鏡像是Docker容器的靜態表示形式,鏡像的安全決定了容器的運行時安全。
Docker容器官方鏡像倉庫Docker Hub中的鏡像可能由個人開發者上傳,其數量豐富、版本多樣,但質量參差不齊,甚至存在包含惡意漏洞的惡意鏡像,因而可能存在較大的安全風險。具體而言,Docker鏡像的安全風險分布在創建過程、獲取來源、獲取途徑等方方面面。
Dockerfile安全問題
Docker鏡像的生成主要包括兩種方式,一種是對運行中的動態容器通過docker commit命令進行打包,另一種是通過docker build命令執行Dockerfile文件進行創建。為了確保最小安裝原則,同時考慮容器的易維護性,一般推薦采用Dockerfile文件構建容器鏡像,即在基礎鏡像上進行逐層應用添加操作。
Dockerfile是包含用于組合鏡像命令的文本文件,一般由基礎鏡像信息(FROM)、維護者信息(MAINTAINER)、鏡像操作指令(RUN、ADD、COPY等)、容器啟動時執行指令(CMD等)四個部分組成,Docker可通過讀取Dockerfile中的命令創建容器鏡像。
Dockerfile文件內容在一定程度上決定了Docker鏡像的安全性,其安全風險具體包括但不限于以下情況:
- 如果Dockerfile存在漏洞或被插入惡意腳本,那么生成的容器也可能產生漏洞或被惡意利用。例如,攻擊者可構造特殊的Dockerfile壓縮文件,在編譯時觸發漏洞獲取執行任意代碼的權限。
- 如果在Dockerfile中沒有指定USER,Docker將默認以root用戶的身份運行該Dockerfile創建的容器,如果該容器遭到攻擊,那么宿主機的root訪問權限也可能會被獲取。
- 如果在Dockerfile文件中存儲了固定密碼等敏感信息并對外進行發布,則可能導致數據泄露的風險。
- 如果在Dockerfile的編寫中添加了不必要的應用,如SSH、Telnet等,則會產生攻擊面擴大的風險。
鏡像漏洞
對于大多數一般的開發者而言,通常需要獲取一系列基礎鏡像進行容器云的部署和進一步開發,因此,基礎鏡像的安全性在一定程度上決定了容器云環境的安全性。
鏡像漏洞安全風險具體包括鏡像中的軟件含有CVE漏洞、攻擊者上傳含有惡意漏洞的鏡像等情況。
1、CVE漏洞
由于鏡像通常由基礎操作系統與各類應用軟件構成,因此,含有CVE漏洞的應用軟件同樣也會向Docker鏡像中引入CVE漏洞。
鏡像的獲取通常是通過官方鏡像倉庫Docker Hub或網易、阿里云等提供的第三方鏡像倉庫。然而,根據對Docker Hub中鏡像安全漏洞的相關研究,無論是社區鏡像還是官方鏡像,其平均漏洞數均接近200個,包括Nginx、MySQL、redis在內的常用鏡像都含有高危漏洞。
2、惡意漏洞
惡意用戶可能將含有后門、病毒等惡意漏洞的鏡像上傳至官方鏡像庫。2018年6月,安全廠商Fortinet和Kromtech在Docker Hub上發現17個包含用于數字貨幣挖礦惡意程序的Docker鏡像,而這 些惡意鏡像當時已有500萬次的下載量 。目前,由于Docker應用在世界范圍內具有廣泛性,全網針對Docker容器的攻擊很多都被用于進行數字貨幣挖礦,為攻擊者帶來實際經濟利益,損害Docker用戶的正常使用。
鏡像倉庫安全
作為搭建私有鏡像存儲倉庫的工具,Docker Registry的應用安全性也必須得到保證。鏡像倉庫的安全風險主要包括倉庫本身的安全風險和鏡像拉取過程中的傳輸安全風險。
- 倉庫自身安全:如果鏡像倉庫特別是私有鏡像倉庫被惡意攻擊者所控制,那么其中所有鏡像的安全性將無法得到保證。例如,如果私有鏡像倉庫由于配置不當而開啟了2357端口,將會導致私有倉庫暴露在公網中,攻擊者可直接訪問私有倉庫并篡改鏡像內容,造成倉庫內鏡像的安全隱患。
- 鏡像拉取安全:如何保證容器鏡像從鏡像倉庫到用戶端的完整性也是鏡像倉庫面臨的一個重要安全問題。由于用戶以明文形式拉取鏡像,如果用戶在與鏡像倉庫交互的過程中遭遇了中間人攻擊,導致拉取的鏡像在傳輸過程中被篡改或被冒名發布惡意鏡像,會造成鏡像倉庫和用戶雙方的安全風險。Docker已在其1.8版本后采用內容校驗機制解決中間人攻擊的問題。
容器虛擬化安全風險
與傳統虛擬機相比,Docker容器不擁有獨立的資源配置,且沒有做到操作系統內核層面的隔離,因此可能存在資源隔離不徹底與資源限制不到位所導致的安全風險。
容器隔離問題
對于Docker容器而言,由于容器與宿主機共享操作系統內核,因此存在容器與宿主機之間、容器與容器之間隔離方面的安全風險,具體包括進程隔離、文件系統隔離、進程間通信隔離等。
雖然Docker通過Namespaces進行了文件系統資源的基本隔離,但仍有/sys、/proc/sys、/proc/bus、/dev、time、syslog等重要系統文件目錄和命名空間信息未實現隔離,而是與宿主機共享相關資源。
針對容器隔離安全風險問題,主要存在以下兩種隔離失效的情況:
- 攻擊者可能通過對宿主機內核進行攻擊達到攻擊其中某個容器的目的。
- 由于容器所在主機文件系統存在聯合掛載的情況,惡意用戶控制的容器也可能通過共同掛載的文件系統訪問其他容器或宿主機,造成數據安全問題。
容器逃逸攻擊
容器逃逸攻擊指的是容器利用系統漏洞,“逃逸”出了其自身所擁有的權限,實現了對宿主機和宿主機上其他容器的訪問。由于容器與宿主機共享操作系統內核,為了避免容器獲取宿主機的root權限,通常不允許采用特權模式運行Docker容器。
在容器逃逸案例中,最為著名的是shocker.c程序,其通過調用open_by_handle_at函數對宿主機文件系統進行暴力掃描,以獲取宿主機的目標文件內容。由于Docker 1.0之前版本對容器能力(Capability)使用黑名單策略進行管理,并沒有限制CAP_DAC_READ_SEARCH能力,賦予了shocker.c程序調用open_by_handle_at函數的能力,導致容器逃逸的發生。因此,對容器能力的限制不當是可能造成容器逃逸等安全問題的風險成因之一。所幸的是,Docker在后續版本中對容器能力采用白名單管理,避免了默認創建的容器通過shocker.c案例實現容器逃逸的情況。
此外,在Black Hat USA 2019會議中,來自Capsule8的研究員也給出了若干Docker容器引擎漏洞與容器逃逸攻擊方法,包括CVE-2019-5736、CVE-2018-18955、CVE-2016-5195等可能造成容器逃逸的漏洞。
拒絕服務攻擊
由于容器與宿主機共享CPU、內存、磁盤空間等硬件資源,且Docker本身對容器使用的資源并沒有默認限制,如果單個容器耗盡宿主機的計算資源或存儲資源(例如進程數量、存儲空間等)可能導致宿主機或其他容器的拒絕服務。
1、計算型DoS攻擊
Fork Bomb是一類典型的針對計算資源的拒絕服務攻擊手段,其可通過遞歸方式無限循環調用fork系統函數快速創建大量進程。由于宿主機操作系統內核支持的進程總數有限,如果某個容器遭到了Fork Bomb攻擊,那么就有可能存在由于短時間內在該容器內創建過多進程而耗盡宿主機進程資源的情況,宿主機及其他容器就無法再創建新的進程。
2、存儲型DoS攻擊
針對存儲資源,雖然Docker通過Mount命名空間實現了文件系統的隔離,但CGroups并沒有針對AUFS文件系統進行單個容器的存儲資源限制,因此采用AUFS作為存儲驅動具有一定的安全風險。如果宿主機上的某個容器向AUFS文件系統中不斷地進行寫文件操作,則可能會導致宿主機存儲設備空間不足,無法再滿足其自身及其他容器的數據存儲需求。
網絡安全風險
網絡安全風險是互聯網中所有信息系統所面臨的重要風險,不論是物理設備還是虛擬機,都存在難以完全規避的網絡安全風險問題。而在輕量級虛擬化的容器網絡環境中,其網絡安全風險較傳統網絡而言更為復雜嚴峻。
容器網絡攻擊
Docker提供橋接網絡、macVLAN、覆蓋網絡(Overlay)等多種組網模式,可分別實現同一宿主機內容器互聯、跨宿主機容器互聯、容器集群網絡等功能。
1、網橋模式
Docker默認采用網橋模式,利用iptables進行NAT轉換和端口映射。Docker將所有容器都通過虛擬網絡接口對連接在一個名為docker0的虛擬網橋上,作為容器的默認網關,而該網橋與宿主機直接相連。
容器內部的數據包經過虛擬網絡接口對到達docker0,實現同一子網內不同容器間的通信。在網橋模式下,同一宿主機內各容器間可以互相通信,而宿主機外部無法通過分配給容器的IP地址對容器進行外部訪問。
由于缺乏容器間的網絡安全管理機制,無法對同一宿主機內各容器之間的網絡訪問權限進行限制。具體而言,由于各容器之間通過宿主機內部網絡的docker0網橋連接以實現路由和NAT轉換,如果容器間沒有防火墻等保護機制,則攻擊者可通過某個容器對宿主機內的其他容器進行ARP欺騙、嗅探、廣播風暴等攻擊,導致信息泄露、影響網絡正常運行等安全后果。
因此,如果在同一臺宿主機上部署的多個容器沒有進行合理的網絡配置進行訪問控制邊界隔離,將可能產生容器間的網絡安全風險。
2、MacVLAN
MacVLAN是一種輕量級網絡虛擬化技術,通過與主機的網絡接口連接實現了與實體網絡的隔離性。
MacVLAN允許為同一個物理網卡配置多個擁有獨立MAC地址的網絡接口并可分別配置IP地址,實現了網卡的虛擬化。MacVLAN模式無需創建網橋,即無需NAT轉換和端口映射就可以直接通過網絡接口連接到物理網絡,不同MacVLAN網絡間不能在二層網絡上進行通信。
然而,處于同一虛擬網絡下各容器間同樣沒有進行訪問權限控制,因此MacVLAN模式依然存在與網橋模式類似的內部網絡攻擊的安全風險。
3、Overlay網絡
Overlay網絡架構主要用于構建分布式容器集群,通過VxLAN技術在不同主機之間的Underlay網絡上建立虛擬網絡,以搭建跨主機容器集群,實現不同物理主機中同一Overlay網絡下的容器間通信。
與其他組網模式一樣,Overlay網絡也沒有對同一網絡內各容器間的連接進行訪問控制。此外,由于VxLAN網絡流量沒有加密,需要在設定IPSec隧道參數時選擇加密以保證容器網絡傳輸內容安全。
因此,無論采用何種網絡連接模式,都難以避免容器間互相攻擊的安全風險。
網絡DoS攻擊
由于網絡虛擬化的存在,容器網絡面臨著與傳統網絡不同的DoS攻擊安全風險。Docker容器網絡的DoS攻擊分為內部威脅和外部威脅兩種主要形式。
- 內部威脅:針對Docker容器網絡環境,DoS攻擊可不通過物理網卡而在宿主機內部的容器之間進行,攻擊者通過某個容器向其他容器發起DoS攻擊可能降低其他容器的網絡數據處理能力。因此,存在容器虛擬網絡間的DoS攻擊風險。
- 外部威脅:由于同一臺宿主機上的所有容器共享宿主機的物理網卡資源,若外部攻擊者使用包含大量受控主機的僵尸網絡向某一個目標容器發送大量數據包進行DDoS攻擊,將可能占滿宿主機的網絡帶寬資源,造成宿主機和其他容器的拒絕服務。
Docker容器安全機制與解決方案
容器虛擬化安全
在傳統虛擬化技術架構中,Hypervisor虛擬機監視器是虛擬機資源的管理與調度模塊。而在容器架構中,由于不含有Hypervisor層,因此需要依靠操作系統內核層面的相關機制對容器進行安全的資源管理。
容器資源隔離與限制
在資源隔離方面,與采用虛擬化技術實現操作系統內核級隔離不同,Docker通過Linux內核的Namespace機制實現容器與宿主機之間、容器與容器之間資源的相對獨立。通過為各運行容器創建自己的命名空間,保證了容器中進程的運行不會影響到其他容器或宿主機中的進程。
在資源限制方面,Docker通過CGroups實現宿主機中不同容器的資源限制與審計,包括對CPU、內存、I/O等物理資源進行均衡化配置,防止單個容器耗盡所有資源造成其他容器或宿主機的拒絕服務,保證所有容器的正常運行。
但是,CGroups未實現對磁盤存儲資源的限制。若宿主機中的某個容器耗盡了宿主機的所有存儲空間,那么宿主機中的其他容器無法再進行數據寫入。Docker提供的–storage-opt=[]磁盤限額僅支持Device MApper文件系統,而Linux系統本身采用的磁盤限額機制是基于用戶和文件系統的quota技術,難以針對Docker容器實現基于進程或目錄的磁盤限額。因此,可考慮采用以下方法實現容器的磁盤存儲限制:
- 為每個容器創建單獨用戶,限制每個用戶的磁盤使用量;
- 選擇XFS等支持針對目錄進行磁盤使用量限制的文件系統;
- 為每個容器創建單獨的虛擬文件系統,具體步驟為創建固定大小的磁盤文件,并從該磁盤文件創建虛擬文件系統,然后將該虛擬文件系統掛載到指定的容器目錄。
此外,在默認情況下,容器可以使用主機上的所有內存。可以使用內存限制機制來防止一個容器消耗所有主機資源的拒絕服務攻擊,具體可使用使用-m或-memory參數運行容器。
- (命令示例: docker run [運行參數] - memory [內存大小] [容器鏡像名或 ID ] [命令])
容器能力限制
Linux內核能力表示進程所擁有的系統調用權限,決定了程序的系統調用能力。
容器的默認能力包括CHOWN、DAC_OVERRIDE、FSETID、SETGID、SETUID、SETFCAP、NET_RAW、MKNOD、SYS_REBOOT、SYS_CHROOT、KILL、NET_BIND_SERVICE、AUDIT_WRITE等等,具體功能如表3所示。
容器默認能力 | 作用 |
---|---|
CHOWN | 允許任意更改文件UID以及GID |
DAC_OVERRIDE | 允許忽略文件的讀、寫、執行訪問權限檢查 |
FSETID | 允許文件修改后保留setuid/setgid標志位 |
SETGID | 允許改變進程組ID |
SETUID | 允許改變進程用戶ID |
SETFCAP | 允許向其他進程轉移或刪除能力 |
NET_RAW | 允許創建RAW和PACKET套接字 |
MKNOD | 允許使用mknod創建指定文件 |
SYS_REBOOT | 允許使用reboot或者kexec_load |
SYS_CHROOT | 允許使用chroot |
KILL | 允許發送信號 |
NET_BIND_SERVICE | 允許綁定常用端口號(端口號小于1024) |
AUDIT_WRITE | 允許審計日志寫入 |
表3:容器默認能力
如果對容器能力不加以適當限制,可能會存在以下安全隱患:
- 內部因素:在運行Docker容器時,如果采用默認的內核功能配置可能會產生容器的隔離問題。
- 外部因素:不必要的內核功能可能導致攻擊者通過容器實現對宿主機內核的攻擊。
因此,不當的容器能力配置可能會擴大攻擊面,增加容器與宿主機面臨的安全風險,在執行docker run命令運行Docker容器時可根據實際需求通過–cap-add或–cap-drop配置接口對容器的能力進行增刪。
- (命令示例: docker run -- cap - drop ALL -- cap - add SYS_TIME ntpd / bin / sh )
強制訪問控制
強制訪問控制(Mandatory Access Control,MAC)是指每一個主體(包括用戶和程序)和客體都擁有固定的安全標記,主體能否對客體進行相關操作,取決于主體和客體所擁有安全標記的關系。在Docker容器應用環境下,可通過強制訪問控制機制限制容器的訪問資源。Linux內核的強制訪問控制機制包括SELinux、AppArmor等。
1、SELinux機制
SELinux(Security-Enhanced Linux)是Linux內核的強制訪問控制實現,由美國國家安全局(NSA)發起,用以限制進程的資源訪問,即進程僅能訪問其任務所需的文件資源。因此,可通過SELinux對Docker容器的資源訪問進行控制。
在啟動Docker daemon守護進程時,可通過將–selinux-enabled參數設為true,從而在Docker容器中使用SELinux。SELinux可以使經典的shocker.c程序失效,使其無法逃逸出Docker容器實現對宿主機資源的訪問。
- (命令示例: docker daemon -- selinux - enabled = true )
2、AppArmor機制
與SELinux類似,AppArmor(Application Armor,應用程序防護)也是Linux的一種強制訪問控制機制,其作用是對可執行程序進行目錄和文件讀寫、網絡端口訪問和讀寫等權限的控制。
在Docker daemon啟動后會在/etc/apparmor.d/docker自動創建AppArmor的默認配置文件docker-default,可通過在該默認配置文件中新增訪問控制規則的方式對容器進行權限控制,同時可在啟動容器時通過–security-opt指定其他配置文件。例如,在配置文件中加入一行deny /etc/hosts rwklx限制對/etc/hosts的獲取,同樣可使shocker.c容器逃逸攻擊失效。
- (命令示例: docker run -- rm - ti -- cap - add = all -- security - opt apparmor : docker - default shocker bash )
Seccomp機制
Seccomp(Secure Computing Mode)是Linux內核提供的安全特性,可實現應用程序的沙盒機制構建,以白名單或黑名單的方式限制進程能夠進行的系統調用范圍。
在Docker中,可通過為每個容器編寫json格式的seccomp profile實現對容器中進程系統調用的限制。在seccomp profile中,可定義以下行為對進程的系統調用做出響應:
- SCMP_ACT_KILL:當進程進行對應的系統調用時,內核發出SIGSYS信號終止該進程,該進程不會接受到這個信號;
- SCMP_ACT_TRAP:當進程進行對應的系統調用時,該進程會接收到SIGSYS信號,并改變自身行為;
- SCMP_ACT_ERRNO:當進程進行對應的系統調用時,系統調用失敗,進程會接收到errno返回值;
- SCMP_ACT_TRACE: 當進程進行對應的系統調用時,進程會被跟蹤;
- SCMP_ACT_ALLOW:允許進程進行對應的系統調用行為。
默認情況下,在Docker容器的啟動過程中會使用默認的seccomp profile,可使用security-opt seccomp選項使用特定的seccomp profile。
- (命令示例: docker run -- rm - it -- security - opt seccomp : /path/ to / seccomp / profile . json hello - world )
容器安全管理
鏡像倉庫安全
1、內容信任機制
Docker的內容信任(Content Trust)機制可保護鏡像在鏡像倉庫與用戶之間傳輸過程中的完整性。目前,Docker的內容信任機制默認關閉,需要手動開啟。內容信任機制啟用后,鏡像發布者可對鏡像進行簽名,而鏡像使用者可以對鏡像簽名進行驗證。
具體而言,鏡像構建者在通過docker build命令運行Dockerfile文件前,需要通過手動或腳本方式將DOCKER_CONTENT_TRUST環境變量置為1進行啟用。在內容信任機制開啟后,push、build、create、pull、run等命令均與內容信任機制綁定,只有通過內容信任驗證的鏡像才可成功運行這些操作。例如,Dockerfile中如果包含未簽名的基礎鏡像,將無法成功通過docker build進行鏡像構建。
- (命令示例: export DOCKER_CONTENT_TRUST = 1 )
2、Notary項目
Notary是一個從Docker中剝離的獨立開源項目,提供數據收集的安全性。Notary用于發布內容的安全管理,可對發布的內容進行數字簽名,并允許用戶驗證內容的完整性和來源。Notary的目標是保證服務器與客戶端之間使用可信連接進行交互,用于解決互聯網內容發布的安全性,并未局限于容器應用。
在Docker容器場景中,Notary可支持Docker內容信任機制。因此,可使用Notary構建鏡像倉庫服務器,實現對容器鏡像的簽名,對鏡像源認證、鏡像完整性等安全需求提供更好的支持。
鏡像安全掃描
為了保證容器運行的安全性,在從公共鏡像倉庫獲取鏡像時需要對鏡像進行安全檢查,防止存在安全隱患甚至惡意漏洞的鏡像運行,從源頭端預防安全事故的發生。鏡像漏洞掃描工具是一類常用的鏡像安全檢查輔助工具,可檢測出容器鏡像中含有的CVE漏洞。
針對Docker鏡像的漏洞掃描,目前已經有許多相關工具與解決方案,包括Docker Security Scanning、Clair、Anchore、Trivy、Aqua等等。
1、Docker Security Scanning服務
Docker Security Scanning是Docker官方推出的不開源鏡像漏洞掃描服務,用于檢測Docker Cloud服務中私有倉庫和Docker Hub官方倉庫中的鏡像是否安全。
Docker Security Scanning包括掃描觸發、掃描器、數據庫、附加元件框架以及CVE漏洞數據庫比對等服務。當倉庫中有鏡像發生更新時,會自動啟動漏洞掃描;當CVE漏洞數據庫發生更新時,也會實時更新鏡像漏洞掃描結果。
2、Clair工具
Clair是一款開源的Docker鏡像漏洞掃描工具。與Docker Security Scanning類似,Clair通過對Docker鏡像進行靜態分析并與公共漏洞數據庫關聯,得到相應的漏洞分析結果。Clair主要包括以下模塊:
- Fetcher(獲取器):從公共的CVE漏洞源收集漏洞數據;
- Detector(檢測器):對鏡像的每一個Layer進行掃描,提取鏡像特征;
- Notifier(通知器):用于接收WebHook從公開CVE漏洞庫中的最新漏洞信息并進行漏洞庫更新;
- Databases(數據庫): PostSQL數據庫存儲容器中的各個層和CVE漏洞。
3、Trivy工具
Trivy是一個簡單而全面的開源容器漏洞掃描程序。Trivy可檢測操作系統軟件包(Alpine、RHEL、centos等)和應用程序依賴項(Bundler、Composer、npm、yarn等)的漏洞。此外,Trivy具有較高的易用性,只需安裝二進制文件并指定掃描容器的鏡像名稱即可執行掃描。Trivy提供了豐富的功能接口,相比于其他容器鏡像漏洞掃描工具更適合自動化操作,可更好地滿足持續集成的需求。
- (命令示例: trivy [鏡像名])
容器運行時監控
為了在系統運維層面保證容器運行的安全性,實現安全風險的即時告警與應急響應,需要對Docker容器運行時的各項性能指標進行實時監控。
針對Docker容器監控的工具與解決方案包括docker stats、cAdvisor、Scout、DataDog、Sensu等等,其中最常見的是Docker原生的docker stats命令和Google的cAdvisor開源工具。
1、docker stats命令
docker stats是Docker自帶的容器資源使用統計命令,可用于對宿主機上的Docker容器的資源使用情況進行手動監控,具體內容包括容器的基本信息、容器的CPU使用率、內存使用率、內存使用量與限制、塊設備I/O使用量、網絡I/O使用量、進程數等信息。用戶可根據自身需求設置–format參數控制docker stats 命令輸出的內容格式。
- (命令示例: docker stats [容器名])
2、cAdvisor工具
由于docker stats只是簡單的容器資源查看命令,其可視化程度不高,同時不支持監控數據的存儲。cAdvisor是由Google開源的容器監控工具,優化了docker stats在可視化展示與數據存儲方面的缺陷。
cAdvisor在宿主機上以容器方式運行,通過掛載在本地卷,可對同一臺宿主機上運行的所有容器進行實時監控和性能數據采集,具體包括CPU使用情況、內存使用情況、網絡吞吐量、文件系統使用情況等信息,并提供本地基礎查詢界面和API接口,方便與其他第三方工具進行搭配使用。cAdvisor默認將數據緩存在內存中,同時也提供不同的持久化存儲后端支持,可將監控數據保存Google BigQuery、InfluxDB或Redis等數據庫中。
cAdvisor基于Go語言開發,利用CGroups獲取容器的資源使用信息,目前已被集成在Kubernetes中的Kubelet組件里作為默認啟動項。
- (命令示例: docker run - v / var / run : /var/ run : rw - v / sys : /sys:ro -v/ var / lib / docker : /var/ lib / docker : ro - p8080 : 8080 - d -- name cadvisor google / cadvisor )
容器安全審計
1、Docker守護進程審計
在安全審計方面,對于運行Docker容器的宿主機而言,除需對主機Linux文件系統等進行審計外,還需對Docker守護進程的活動進行審計。由于系統默認不會對Docker守護進程進行審計,需要通過主動添加審計規則或修改規則文件進行。
- (命令示例: auditctl - w / usr / bin / docker - k docker 或修改/ etc / audit / audit . rules 文件)
2、Docker相關文件目錄審計
除Docker守護進程之外,還需對與Docker的運行相關的文件和目錄進行審計,同樣需要通過命令行添加審計規則或修改規則配置文件,具體文件和目錄如表4所示。
需要審計的文件或目錄 | 備注 |
---|---|
/var/lib/docker | 包含有關容器的所有信息 |
/etc/docker | 包含Docker守護進程和客戶端TLS通信的密鑰和證書 |
docker.service | Docker守護進程運行參數配置文件 |
docker.socket | 守護進程運行socket |
/etc/default/docker | 支持Docker守護進程各種參數 |
/etc/default/daemon.json | 支持Docker守護進程各種參數 |
/usr/bin/docker-containerd | Docker可用containerd生成容器 |
/usr/bin/docker-runc | Docker可用runC生成容器 |
表4:Docker相關文件和目錄審計
Docker公司與美國互聯網安全中心(CIS)聯合制定了Docker最佳安全實踐CIS Docker Benchmark,目前最新版本為1.2.0。為了幫助Docker用戶對其部署的容器環境進行安全檢查,Docker官方提供了Docker Bench for Security安全配置檢查腳本工具docker-bench-security,其檢查依據便是CIS制定的Docker最佳安全實踐。
容器網絡安全
容器間流量限制
由于Docker容器默認的網橋模式不會對網絡流量進行控制和限制,為了防止潛在的網絡DoS攻擊風險,需要根據實際需求對網絡流量進行相應的配置。
1、完全禁止容器間通信
在特定的應用場景中,如果宿主機中的所有容器無需在三層或四層進行網絡通信交互,可通過將Docker daemon的–icc參數設為false以禁止容器與容器間的通信。
- (命令示例: dockerd -- icc = false )
2、容器間流量控制
在存在多租戶的容器云環境中,可能存在單個容器占用大量宿主機物理網卡搶占其他容器帶寬的情況。為了保證容器之間的正常通信,同時避免異常流量造成網絡DoS攻擊等后果,需要對容器之間的通信流量進行一定的限制。
由于Docker通過創建虛擬網卡對(eth0和veth*)將容器與虛擬網橋docker0連接,而容器之間的通信需要經由虛擬網卡對eth0和veth*通過網橋連接,因此,可采用Linux的流量控制模塊traffic controller對容器網絡進行流量限制。
traffic controller的原理是建立數據包隊列并制定發送規則,實現流量限制與調度的功能。為了在一定程度上減輕容器間的DoS攻擊的危害,可將traffic controller的dev設置為宿主機中與各容器連接的veth*虛擬網卡,以此進行宿主機上容器間流量限制。
網橋模式下的網絡訪問控制
在默認的網橋連接模式中,連接在同一個網橋的兩個容器可以進行直接相互訪問。因此,為了實現網絡訪問控制,可按需配置網絡訪問控制機制和策略。
1、為容器創建不同的橋接網絡
為了實現容器間的網絡隔離,可將容器放在不同的橋接網絡中。當在Docker中使用docker network create命令創建新的橋接網絡時,會在iptables中的DOCKER-ISOLATION新增DROP丟棄規則,阻斷與其他網絡之間的通信流量,實現容器網絡之間隔離的目的。
- (命令示例: docker network create -- subnet 102.102 . 0.0 / 24 test )
2、基于白名單策略的網絡訪問控制
為了保證容器間的網絡安全,可默認禁止容器間的通信,然后按需設置網絡訪問控制規則。
具體而言,在同一虛擬網絡內,不同Docker容器之間的網絡訪問可通過iptables進行控制。在將Docker daemon的–icc參數設為false后,iptables的FORWARD鏈策略為默認全部丟棄。此時,可采用白名單策略實現網絡訪問控制,即根據實際需要在iptables中添加訪問控制策略,以最小化策略減小攻擊面。
集群模式下的網絡訪問控制
與通過OpenStack建立的虛擬化集群通過VLAN對不同租戶進行子網隔離不同,基于Overlay網絡的容器集群在同一主機內相同子網中的不同容器之間默認可以直接訪問。
如需控制宿主機外部到內部容器應用的訪問,可通過在宿主機iptables中的DOCKER-INGRESS鏈手動添加ACL訪問控制規則以控制宿主機的eth0到容器的訪問,或者在宿主機外部部署防火墻等方法實現。
然而,在大型的容器云環境中,由于存在頻繁的微服務動態變化更新,通過手動的方式配置iptables或更新防火墻是不現實的。因此,可通過微分段(Micro-Segmentation)實現面向容器云環境中的容器防火墻。微分段是一種細粒度的網絡分段隔離機制,與傳統的以網絡地址為基本單位的網絡分段機制不同,微分段可以以單個容器、同網段容器、容器應用為粒度實現分段隔離,并通過容器防火墻對實現微分段間的網絡訪問控制。
總結
與虛擬化技術相比,Docker容器技術具有敏捷化、輕量化等特點,在推進云原生應用方面具有不可替代性。與此同時,容器技術對于高效性的追求也犧牲了隔離性等安全要求,在安全性方面與虛擬化技術相比還存在較大差距,且所涉及的面較廣,涉及到容器的鏡像安全、內核安全、網絡安全、虛擬化安全、運行時安全等各個層面。
在應用容器技術進行系統部署時,應充分評估安全風險,根據應用場景制定相應安全需求,并整合相關安全解決方案,形成容器安全應用最佳實踐。
文章來源:FreeBuf.COM。