本篇文章收錄于2021年網(wǎng)絡(luò)安全頂會(huì)NDSS,介紹了最新的符號(hào)執(zhí)行技術(shù),并且清晰地比較了當(dāng)前流行的各種符號(hào)執(zhí)行的引擎的優(yōu)劣勢(shì),可以比較系統(tǒng)的了解符號(hào)執(zhí)行技術(shù)的相關(guān)知識(shí)
title = {{SymQEMU}: Compilation-based symbolic execution for binaries},
author = {Poeplau, Sebastian and Francillon, Aurélien},
booktitle = .NETwork and Distributed System Security Symposium},
year = 2021, organization = {Network & Distributed System Security Symposium},
month = {February}, affiliations = {Eurecom, Code Intelligence},
extralink = {Details: tools/symbolic_execution/symqemu.html}
download_address = https://www.ndss-symposium.org/wp-content/uploads/2021-118-paper.pdf`
摘 要
符號(hào)執(zhí)行技術(shù)是針對(duì)軟件分析和bug檢測(cè)的強(qiáng)力技術(shù),基于編譯的符號(hào)執(zhí)行技術(shù)是最近提出的一種方法,當(dāng)對(duì)象源代碼可以得到時(shí)可以提升符號(hào)執(zhí)行的性能。本文提出了一種新的基于編譯的,針對(duì)二進(jìn)制文件的符號(hào)執(zhí)行技術(shù)。此系統(tǒng)名為symqemu,在qemu基礎(chǔ)之上開發(fā),在將target程序轉(zhuǎn)換為host架構(gòu)的機(jī)器碼之前修改其IR,這使得symqemu能夠?qū)⒕幾g符號(hào)執(zhí)行引擎的能力應(yīng)用于二進(jìn)制文件,并且在維持架構(gòu)獨(dú)立性的同時(shí)能夠獲得性能上的提升。
本文提出了這個(gè)方法以及其實(shí)現(xiàn),我們利用統(tǒng)計(jì)學(xué)方法證明了他比最先進(jìn)的符號(hào)執(zhí)行引擎s2e以及qsym,在某些benchmarks上,他甚至由于針對(duì)源碼帶分析的symcc。并且利用symqemu在經(jīng)過多重測(cè)試的library上發(fā)現(xiàn)了一個(gè)位置漏洞,證明了他在實(shí)際軟件中的可用性。
介 紹
符號(hào)執(zhí)行技術(shù)近年來大力發(fā)展,一種有效但是代價(jià)大的技術(shù),其經(jīng)常與fuzzing技術(shù)混合,并成為混合fuzzing,fuzzing用來探索容易到達(dá)的路徑,而符號(hào)執(zhí)行用來探索不易到達(dá)的路徑。
針對(duì)符號(hào)執(zhí)行技術(shù)的重要特征之一就是其是否需要提供源代碼進(jìn)行分析,而真實(shí)世界中的大多數(shù)程序(由于某些原因)是不提供源代碼的。
所以binary-only的符號(hào)執(zhí)行技術(shù)被迫切需要,但是面臨一個(gè)兩難的困境,到底是選擇性能的提升還是架構(gòu)的獨(dú)立性呢?比如,QSYM針對(duì)binary有很高的性能,但是其僅限于x86處理器的指令集。它不僅僅造成了系統(tǒng)架構(gòu)依賴性,并且由于現(xiàn)在處理器指令的龐大提升了其復(fù)雜性。SE則是可以被廣泛的應(yīng)用但是性能較差,S2E可以分析多架構(gòu)代碼以及內(nèi)核代碼。然而他這么做的代價(jià)是針對(duì)target程序的多種翻譯的最終表示,導(dǎo)致了復(fù)雜性升高以及影響性能。
在本文中,我們提出了一個(gè)方法(a)獨(dú)立于被測(cè)試的程序的target架構(gòu)(b)實(shí)現(xiàn)復(fù)雜度低(c)具有高性能。symqemu的關(guān)鍵是qemu的cpu 仿真可以同于輕量級(jí)的符號(hào)執(zhí)行機(jī)制:不是像s2e中使用中的那種計(jì)算復(fù)雜度高的將target程序向IR的轉(zhuǎn)換方式,我們hook qemu中的二進(jìn)制轉(zhuǎn)換機(jī)制為了將符號(hào)處理直接編譯到機(jī)器碼中。這樣使得在性能優(yōu)于最先進(jìn)符號(hào)執(zhí)行系統(tǒng)的同時(shí)可以保持加夠獨(dú)立性。目前,我們針對(duì)于linux用戶程序(ELF binaries),但我們可以將其拓展到任何qemu支持的架構(gòu)中取,同時(shí)我們將symqemu開源來加速未來相關(guān)領(lǐng)域的研究。
將符號(hào)處理編譯到target程序中同樣是symcc的核心工作,其性能優(yōu)于其他符號(hào)執(zhí)行引擎,但是symcc只針對(duì)于有源碼的程序。symqemu性能優(yōu)于se2以及qsym,并且相比于基于源代碼的symcc性能來說,某些情況也是可以比較。
本文工作主要有一下貢獻(xiàn):
- 分析了當(dāng)前最先進(jìn)的binary-only的符號(hào)執(zhí)行引擎并且明確了其設(shè)計(jì)中的優(yōu)勢(shì)和劣勢(shì)。
- 提出了一個(gè)方法,融合了其他工具的優(yōu)勢(shì),避免了其他工具的缺點(diǎn),核心idea是應(yīng)用基于編譯的符號(hào)執(zhí)行技術(shù)到binary上,我們工具的源代碼開源。
- 進(jìn)行了詳細(xì)的評(píng)價(jià)試驗(yàn),并且實(shí)驗(yàn)數(shù)據(jù)以及實(shí)驗(yàn)?zāi)_本開源。
背 景
符號(hào)執(zhí)行
符號(hào)執(zhí)行的目的是在目標(biāo)程序的執(zhí)行過程中跟蹤中間值是如何計(jì)算的,每一個(gè)中間值都可以表示為程序輸入的一個(gè)公式。在任何點(diǎn),系統(tǒng)都會(huì)使用這個(gè)公式查看這個(gè)點(diǎn)是否可達(dá),這個(gè)指針是否為空等。如果答案是確定的,那么符號(hào)執(zhí)行引擎將會(huì)提供測(cè)試用例,一個(gè)新的輸入例子來觸發(fā)對(duì)應(yīng)的行為。所以符號(hào)執(zhí)行可以被方便的用來探測(cè)程序路徑以及觸發(fā)bug。
為了跟蹤程序的計(jì)算過程,符號(hào)執(zhí)行系統(tǒng)必須對(duì)程序指令集有一個(gè)深入的理解,許多實(shí)現(xiàn)都是通過將程序翻譯為IR,比如LLVM和VEX。IR隨后被符號(hào)化執(zhí)行,因?yàn)閳?zhí)行器只需要處理IR(通常由少量的指令集構(gòu)成),所以實(shí)現(xiàn)相對(duì)比較簡(jiǎn)單。<font color=red>并且在之前的工作中我們發(fā)現(xiàn),在對(duì)進(jìn)行測(cè)試的程序的高級(jí)表示的查詢較低級(jí)指令的表示的查詢更加容易解決。</font>
然而將程序轉(zhuǎn)換為IR需要計(jì)算能力并且對(duì)程序執(zhí)行過程引入了開銷;然而一些實(shí)現(xiàn)過程放棄了翻譯而直接工作在機(jī)器代碼上,這種解決方案除了性能上的優(yōu)勢(shì),同時(shí)在執(zhí)行器無法怎樣解釋指令時(shí),會(huì)幫助提升魯棒性。然而在另一方面,這種解決方案會(huì)導(dǎo)致執(zhí)行器被限制在了一種特定的架構(gòu)之中。另一種基于源碼的執(zhí)行器在實(shí)際中并不是那么廣泛使用,因?yàn)榇蠖鄶?shù)情況下只能得到二進(jìn)制文件。
binary-only符號(hào)執(zhí)行
僅僅針對(duì)二進(jìn)制文件的符號(hào)執(zhí)行添加了許多挑戰(zhàn):缺少源代碼,將程序翻譯為IR需要可靠的反匯編器;由于靜態(tài)反匯編的挑戰(zhàn),大多數(shù)實(shí)現(xiàn)都是在運(yùn)行態(tài)按需進(jìn)行反匯編。當(dāng)源碼不可得時(shí),針對(duì)架構(gòu)的支持同樣也是重要的,此時(shí)交叉編譯不可行。尤其針對(duì)嵌入式設(shè)備來說,缺少對(duì)多架構(gòu)的支持是不可行的。
無需翻譯的執(zhí)行器除了面對(duì)復(fù)雜實(shí)現(xiàn)帶來的可維護(hù)問題外,還面臨可移植性問題。將程序翻譯為中間語(yǔ)言的執(zhí)行器需要可靠的反匯編器,已經(jīng)有大量的工作來確定翻譯器的準(zhǔn)確性。基于源碼的執(zhí)行器可以較容易的獲得IR。
基于二進(jìn)制文件的符號(hào)執(zhí)行對(duì)于高性能以及多架構(gòu)支持具有更迫切的需求。
最先進(jìn)解決方案
下面描述最先進(jìn)的符號(hào)執(zhí)行實(shí)驗(yàn)方案以及他們各自對(duì)應(yīng)解決的問題。
angr
一個(gè)經(jīng)典的符號(hào)執(zhí)行翻譯器,使用VEX,Valgrind框架的翻譯器和IR。目標(biāo)程序在運(yùn)行時(shí)被翻譯。其中一個(gè)優(yōu)化,angr可以在Unicorn,基于qemu的快速CPU模擬器,上執(zhí)行不涉及符號(hào)數(shù)據(jù)的計(jì)算。
由于基于VEX,agnr固然可以支持所有VEX能夠處理的架構(gòu),因?yàn)閍ngr核心由Python/ target=_blank class=infotextkey>Python語(yǔ)言實(shí)現(xiàn),所以他速度慢但是很通用。
s2e
由于想要將基于源代碼符號(hào)執(zhí)行覆蓋范圍拓展到目標(biāo)程序依賴以及操作系統(tǒng)內(nèi)核,創(chuàng)造了s2e。為了實(shí)現(xiàn)這個(gè)目的,s2e在qemu仿真器內(nèi)執(zhí)行整個(gè)操作系統(tǒng)并且將其與KLEE鏈接為了符號(hào)化執(zhí)行相關(guān)代碼。
這個(gè)系統(tǒng)相當(dāng)復(fù)雜,包括被測(cè)試程序的多重翻譯:
- QEMU是一個(gè)二進(jìn)制文件翻譯器,比如在通常操作中,他講目標(biāo)程序從機(jī)器代碼翻譯為一種中間表示即TCG ops,然后將其重新編譯為針對(duì)host CPU的機(jī)器碼。
- 當(dāng)執(zhí)行是設(shè)計(jì)符號(hào)化數(shù)據(jù)時(shí),S2E使用的修改過的QEEMU不再將TCGops重編譯為機(jī)器代碼,他將其翻譯為L(zhǎng)LVM bitcode,隨后將其傳遞給KLEE。
- KLEE符號(hào)化解釋執(zhí)行LLVM bitcode,然后將結(jié)果的具體情況回傳給QEMU。
此系統(tǒng)可以很靈活的處理不同處理器架構(gòu),并且可以支持針對(duì)操作系統(tǒng)全層面的計(jì)算跟蹤。然而他需要付出一下代價(jià):S2E是一個(gè)具有龐大代碼基礎(chǔ)的復(fù)雜系統(tǒng)。并且兩部分翻譯,從機(jī)器碼翻譯為TCG ops和從TCG ops翻譯為L(zhǎng)LVM bitcode損害了他的性能。與angr針對(duì)用戶態(tài)程序來比較,S2E需要更多的設(shè)計(jì)建立以及運(yùn)行,但是提供了一個(gè)更加全面的分析。
QSYM
QSYM在性能上有極大的增強(qiáng),他不將目標(biāo)程序翻譯為中間語(yǔ)言。他在運(yùn)行態(tài)時(shí)向x86機(jī)器碼內(nèi)進(jìn)行插樁來向二進(jìn)制文件內(nèi)添加符號(hào)追蹤。具體來講,他應(yīng)用了Inter Pin,一種動(dòng)態(tài)二進(jìn)制插樁框架,來向目標(biāo)程序內(nèi)插入hook代碼。在hook內(nèi)部,他和程序運(yùn)行的實(shí)際代碼等價(jià)的運(yùn)行符號(hào)代碼。
這種方式產(chǎn)生了一種針對(duì)x86程序的非常快速并且魯棒性很強(qiáng)的符號(hào)執(zhí)行引擎。然而,這個(gè)系統(tǒng)固然會(huì)被限制在x86框架內(nèi),并且實(shí)現(xiàn)是繁瑣的,因?yàn)樗枰幚碓谟?jì)算中可能出現(xiàn)的任何指令。并且將其遷移到其他架構(gòu)將會(huì)有很大的困難。
symcc
最近提出的符號(hào)執(zhí)行工具,SYMCC,同樣是本文作者之前的工作,基于源代碼的,不支持分析二進(jìn)制文件。SYMQEMU的靈感來自于SYMCC,所以簡(jiǎn)要概括一下他的設(shè)計(jì)。
我們?cè)谠O(shè)計(jì)SYMCC時(shí)觀察到,目前大多數(shù)符號(hào)執(zhí)行系統(tǒng)是解釋器。然而我們卻提出一個(gè)基于編譯的方法,并且展示了他能夠提升執(zhí)行性能以及系統(tǒng)實(shí)際探索能力。SYMCC在編譯器內(nèi)進(jìn)行hook,并且在target代碼內(nèi)進(jìn)行插裝,并且注入實(shí)施支持庫(kù)的調(diào)用。因此符號(hào)執(zhí)行成為了被編譯文件的一部分。并且分析代碼可以進(jìn)行優(yōu)化,并且插裝代碼并不會(huì)在每次執(zhí)行時(shí)進(jìn)行重復(fù)。
SYMCC基于編譯的方式需要編譯器,所以他只能在被測(cè)試程序源代碼可用時(shí)發(fā)揮作用。盡管如此,我們認(rèn)為這個(gè)方式是足夠有前途,所以一直尋找一種方式將其應(yīng)用到binary-only的方面之中,本文的主要工作就是說明基于編譯的符號(hào)執(zhí)行系統(tǒng)是如何在二進(jìn)制文件上高效的工作。
SYMQEMU
現(xiàn)在提出針對(duì)binry-only設(shè)計(jì)實(shí)現(xiàn)的SYMQEMU。他的靈感來自于之前的工作并結(jié)合了如今最先進(jìn)的符號(hào)執(zhí)行系統(tǒng)的技術(shù)。
design
系統(tǒng)兩個(gè)主要目標(biāo):
- 實(shí)現(xiàn)高效能,以致于實(shí)際軟件。
- 合理的架構(gòu)獨(dú)立性,比如將其遷移到新的處理器架構(gòu)不需要做過多工作。
基于之前的調(diào)查,我們發(fā)現(xiàn)流行的最先進(jìn)的符號(hào)執(zhí)行系統(tǒng)實(shí)現(xiàn)了如下兩個(gè)目標(biāo)中的一個(gè),但并非全部:angr和s2e是架構(gòu)靈活的但是性能差;QSYM在性能上比較高但是其只針對(duì)x86架構(gòu)。
如今針對(duì)架構(gòu)獨(dú)立的解決方案是將被測(cè)程序翻譯為IR,這樣如果想要支持一個(gè)新的架構(gòu),只有翻譯器需要移植,理想情況下,我們選擇一種中間語(yǔ)言,其已經(jīng)存在支持多種架構(gòu)的相關(guān)翻譯器。以中間語(yǔ)言靈活地表示程序是一種著名的,已經(jīng)成功的應(yīng)用于許多其他領(lǐng)域的技術(shù),比如編譯器設(shè)計(jì)以及靜態(tài)代碼分析。我們也將這種技術(shù)合并到我們的設(shè)計(jì)中來。
當(dāng)將程序翻譯為中間語(yǔ)言獲得便利的同時(shí),我們同樣需要了解這種方式對(duì)于性能的影響:將binary-only程序靜態(tài)翻譯是具有挑戰(zhàn)性的,因?yàn)榉磪R編器可能是不可靠的,尤其是存在間接跳轉(zhuǎn)的情況下,并且在分析過程中運(yùn)行時(shí)進(jìn)行翻譯會(huì)提升功耗。我們認(rèn)為這是s2e性能劣于QSYM的主要原因。我們的目標(biāo)就是找到一種翻譯系統(tǒng)同時(shí)保持性能優(yōu)越。
首先,我們主要到s2e以及angr都收到了非重要問題的影響,并且這些問題都是可以通過工程方面的工作解決的:
- S2E將被測(cè)試程序翻譯了兩次,然而如果符號(hào)執(zhí)行過程是在第一次中間表示上實(shí)現(xiàn)的話,第二次翻譯過程其實(shí)是可以避免的。
- angr的性能受到python實(shí)現(xiàn)影響,將其核心代碼移植到一種更快速的語(yǔ)言中會(huì)顯著提升速度。
然而我們的貢獻(xiàn)并不僅僅是找出并且避免上述兩個(gè)問題,我們還觀測(cè)到:s2e以及angr,以及其他所有的binaty-only的符號(hào)執(zhí)行器,都解釋執(zhí)行被測(cè)試程序的中間表示,解釋是設(shè)計(jì)的核心部分。我們推測(cè),將目標(biāo)程序編譯為插樁版本將會(huì)帶來很高的性能上的提升。雖然SYMCC是基于源代碼的,基于編譯的符合執(zhí)行引擎,但是他證明了這一點(diǎn)。
收到上述觀測(cè)到的啟發(fā),我們的設(shè)計(jì)方法如下:
- 在運(yùn)行態(tài)將目標(biāo)程序翻譯為IR。
- 為符號(hào)執(zhí)行所需的IR插樁。
- 將IR編譯為適合CPU運(yùn)行分析的機(jī)器碼并且直接執(zhí)行。
通過將插樁的目標(biāo)程序編譯為機(jī)器碼,補(bǔ)償了在第一階段將二進(jìn)制文件翻譯為中間代碼時(shí)的性能損失。CPU執(zhí)行機(jī)器碼比解釋器運(yùn)行IR速度快得多,因此我們獲得了一個(gè)可以與沒有翻譯的系統(tǒng)的性能相當(dāng)?shù)南到y(tǒng),同時(shí)由于進(jìn)行了程序翻譯可以保持架構(gòu)的獨(dú)立性。
implementation
我們?cè)趒emu的基礎(chǔ)之上實(shí)現(xiàn)了SYMQEMU,選擇qemu的原因是因?yàn)樗且粋€(gè)魯棒性的系統(tǒng)仿真器,并且可以支持許多架構(gòu),在他的基礎(chǔ)之上進(jìn)行實(shí)現(xiàn),我們可以實(shí)現(xiàn)架構(gòu)獨(dú)立性。并且qemu還有另一個(gè)特點(diǎn)正好滿足我們的需求,他不僅將二進(jìn)制文件翻譯為針對(duì)處理器獨(dú)立的IR,他同時(shí)支持將中間語(yǔ)言便已成為host CPU的機(jī)器碼。qemu的主要優(yōu)點(diǎn)是他能夠?qū)⒍M(jìn)制文件翻譯為不同host架構(gòu)的機(jī)器代碼,并且可以完成全系統(tǒng)仿真,方便于之后拓展支持交叉架構(gòu)的固件分析。
具體來說,我們拓展了QEMU的組件TCG。在未被修改的qemu中,TCG負(fù)責(zé)將guest架構(gòu)的機(jī)器碼塊翻譯為架構(gòu)獨(dú)立的語(yǔ)言,叫做TCG ops,然后編譯這些TCG ops為host架構(gòu)的機(jī)器碼。由于性能原因,這些翻譯好的blocks隨后被緩存,所以翻譯在每次執(zhí)行過程中只需要進(jìn)行一次。SYMQEMU在這過程中插入了一步:當(dāng)被測(cè)程序翻譯為TCG ops時(shí),我們不僅插樁來模擬guest CPU而且產(chǎn)生一些額外的TCG ops來建立對(duì)應(yīng)的符號(hào)約束表達(dá)式。針對(duì)建立符號(hào)表達(dá)式以及求解這些的支持庫(kù),symqemu重用SYMCC的支持庫(kù),即重用QSYM的。
(此處有詳細(xì)例子,感興趣去讀原文)
目前我們使用的qemu linux用戶模式的仿真,即我們只模擬了普通用戶空間的guest系統(tǒng)。系統(tǒng)調(diào)用被轉(zhuǎn)換來滿足host架構(gòu)的要求,這些是針對(duì)host的內(nèi)核來工作的,使用了qemu常規(guī)的機(jī)制。因此我們的符號(hào)執(zhí)行分析在系統(tǒng)調(diào)用處停止,與QSYM以及angr類似。與全系統(tǒng)仿真(比如s2e)來講,這樣節(jié)省了為每個(gè)target架構(gòu)準(zhǔn)備系統(tǒng)鏡像的方面,并且提升了性能,因?yàn)槭侵苯舆\(yùn)行kernel代碼而不是通過仿真。但是如果需要的話,SYMQEMU是很容易的被拓展為QEMU的全系統(tǒng)仿真。
架構(gòu) 獨(dú)立
首先要明確,執(zhí)行分析的主機(jī)的架構(gòu)叫做host,被測(cè)代碼在其架構(gòu)之上被編譯的叫做guest。尤其是在嵌入式設(shè)備分析中,host與guest架構(gòu)不同是顯然的,嵌入式設(shè)備的系統(tǒng)進(jìn)行符號(hào)執(zhí)行分析的能力不足,所以將固件放置到其他系統(tǒng)中進(jìn)行分析,SYMQEMU就是為這種情況準(zhǔn)備的,能夠在多架構(gòu)下運(yùn)行。
SYMQEMU利用qemu TCG translators,涵蓋多種處理器類型,并且我們針對(duì)其修改幾乎獨(dú)立于target架構(gòu)。
也就是說,SYMQEMU可以在相關(guān)的host架構(gòu)上運(yùn)行并且可以支持所有qemu能夠處理的guest架構(gòu)下的二進(jìn)制文件的分析。
與之前的設(shè)計(jì)比較
本節(jié)之處SYMQEMU與最先進(jìn)的符號(hào)執(zhí)行系統(tǒng)的不同之處。
與angr和s2e相似,SYMQEMU使用傳統(tǒng)的,以IR來完成符號(hào)執(zhí)行處理,顯著的降低了實(shí)現(xiàn)的復(fù)雜性。但是不同于此二者的是,他是基于編譯的符號(hào)執(zhí)行技術(shù),顯著的提升了性能。
與QSYM比較,SYMQEMU設(shè)計(jì)最重要的優(yōu)勢(shì)是架構(gòu)靈活性的同時(shí),能夠維持很高的執(zhí)行速度。在qemu之上進(jìn)行設(shè)計(jì)使其能夠或者很多的數(shù)量的模擬器支持的架構(gòu)處理能力。
SYMCC雖然不能夠分析二進(jìn)制代碼,但是其給SYMQEMU提供了基于編譯的思路。此二者都是通過修改其IR來在目標(biāo)程序中插入符號(hào)處理,并且都是將結(jié)果直接編譯為能夠高效運(yùn)行的機(jī)器碼。然而SYMCC是面向源代碼的,而SYMQEMU解決了分析二進(jìn)制文件的不同指令集的挑戰(zhàn),SYMQEMU在翻譯過程中的TCG ops中插樁,SYMCC在編程過程中的LLVM bitcode內(nèi)插樁。并且SYMQEMU解決了guest和target架構(gòu)不匹配的問題。
我們認(rèn)為本文工作結(jié)合了s2e以及angr的優(yōu)勢(shì),即多架構(gòu)支持,同時(shí)結(jié)合了symcc的優(yōu)點(diǎn),高性能,摒棄了他們的缺點(diǎn);并且我們找到了一種方式,能夠?qū)YMCC的核心idea應(yīng)用到二進(jìn)制文件的分析之中。
內(nèi)存管理
當(dāng)symqemu分析軟件時(shí),他會(huì)建立很多符號(hào)公式來描述中間結(jié)果和路徑約束。他們占用的內(nèi)存會(huì)隨著時(shí)間而一直增長(zhǎng),所以symqemu需要一種方式來清除那些不再被使用的公式。
首先我們討論一下為什么內(nèi)存管理是第一位的。IR在任何合理的程序中或?qū)Τ绦蛄饔杏绊懀蛘叱蔀樽罱K結(jié)果的一部分;在前者情況下,對(duì)應(yīng)的表達(dá)式被添加到路徑約束的集合中,并且不能被清楚;但是針對(duì)后者情況,表達(dá)式成為最終結(jié)果的描述中的字表達(dá)式。所以符號(hào)表達(dá)式是什么時(shí)候變成不重要的呢?關(guān)鍵就是程序的輸出是程序結(jié)果的一部分,但是他可能在程序的結(jié)束之前就已經(jīng)產(chǎn)生了。
所以我們應(yīng)該在符號(hào)在最后一次使用之后將其清除。QSYM使用的C++ smart points來實(shí)現(xiàn)了這個(gè)目的,但是我們?cè)诒恍薷牡膓emu中不能簡(jiǎn)單的相同的辦法:TCG是一個(gè)動(dòng)態(tài)翻譯器,由于性能因素,它不產(chǎn)生任何被翻譯代碼的拓展分析。這使得高效的確定插入清除代碼的位置非常困難。并且經(jīng)驗(yàn)告訴我們,大多數(shù)程序中包含很少的,在程序執(zhí)行過程之中無用的,相關(guān)符號(hào)數(shù)據(jù)和表達(dá)式,所以我們不想我們的清除機(jī)制造成很大的功耗。
我們使用了一種樂觀的清除機(jī)制,在一種expression garbage collector的基礎(chǔ)之上:SYMQEMU跟蹤所有從后端獲得的符號(hào)表達(dá)式,如果他們的數(shù)目非常大時(shí)進(jìn)行回收。最主要的觀測(cè)是所有l(wèi)ive表達(dá)式可以通過掃描如下發(fā)現(xiàn)
- 模擬的CPU符號(hào)寄存器
- 存儲(chǔ)對(duì)應(yīng)符號(hào)內(nèi)存結(jié)果的符號(hào)表達(dá)式的,內(nèi)存中的shadow regions
以上兩種,后端都是可感知的。在感知到所有l(wèi)ive表達(dá)式之后,symqemu將其與所有已經(jīng)創(chuàng)建的符號(hào)表達(dá)式進(jìn)行比較,并且釋放那些不再使用的表達(dá)式。尤其是當(dāng)一個(gè)程序在寄存器和內(nèi)存中移除了計(jì)算的結(jié)果,對(duì)應(yīng)的符號(hào)表達(dá)式同樣被認(rèn)為不再使用也被移除。我們將 expression garbage collector 和QSYM’s smart pointer based memory management相聯(lián)系,這兩種基礎(chǔ)都認(rèn)為表達(dá)式不再使用之后可以被釋放。
修改TCG ops
我們的方法要求能夠像TCG ops中插樁。然而TCG不支持在翻譯過程之中的拓展修改功能,作為一個(gè)翻譯器,他高度關(guān)注速度問題。因?yàn)椋瑢?duì)于TCG ops的程序化修改的工作很少。然而LLVM提供了豐富的API,支持compiler檢查和修改LLVM bitcode。TCG ops單純的將指令存儲(chǔ)在一個(gè)平面鏈表中,而沒有任何高層次的類似于基本快的數(shù)據(jù)結(jié)構(gòu)。并且程序流被期望與翻譯塊呈線性關(guān)系。
為了不和TCG產(chǎn)生不一致,我們的實(shí)現(xiàn)對(duì)每一個(gè)指令生成時(shí)進(jìn)行符號(hào)處理。雖然這種方法可以避免與TCG 優(yōu)化以及代碼生成器產(chǎn)生的問題,但是使得靜態(tài)優(yōu)化技術(shù)不可行,因?yàn)槲覀兠看蝺H僅關(guān)注一條指令。尤其是我們無法靜態(tài)確定給定的值是否是實(shí)際值,并且如果所有的操作都是符號(hào)值的情況下,我們也不能產(chǎn)生跳過符號(hào)計(jì)算的階段的跳轉(zhuǎn)。
因此我們最終于TCG所需要的運(yùn)行環(huán)境的限制條件達(dá)成了妥協(xié),同時(shí)允許我們有相關(guān)很高的執(zhí)行速度:我們?cè)谥С值恼{(diào)用庫(kù)中進(jìn)行實(shí)際值性檢查,這樣,如果實(shí)際計(jì)算的輸入都是準(zhǔn)確值的話,就可以直接跳過符號(hào)值計(jì)算,但是這樣會(huì)導(dǎo)致額外的庫(kù)調(diào)用開銷。
shadow call stack
QSYM引入了上下文敏感的基本快剪枝,如果在同樣的調(diào)用堆棧環(huán)境中頻繁調(diào)用確定的計(jì)算會(huì)導(dǎo)致壓抑符號(hào)執(zhí)行(基于如下直覺,在同樣的上下文環(huán)境中重復(fù)的執(zhí)行分析并不會(huì)導(dǎo)致新的發(fā)現(xiàn))。為了實(shí)現(xiàn)這個(gè)優(yōu)化,符號(hào)執(zhí)行需要維護(hù)一個(gè)shadow call stack,記錄跟蹤call以及return指令。
在qemu基礎(chǔ)之上,我們面臨一個(gè)新的挑戰(zhàn),TCG ops是一個(gè)非常低級(jí)別的target程序的中間表示。尤其是,call以及return指令不是被表示為單獨(dú)的指令而是被翻譯為一系列TCG ops。比如一個(gè)在x86架構(gòu)下的程序調(diào)用會(huì)生成TCG ops,其將返回地址push到模擬的stack上,調(diào)整guest的stack pointer,并且根據(jù)被調(diào)用函數(shù)來修改guest的指令。這使得僅僅通過檢測(cè)TCG ops來以一個(gè)可靠并且架構(gòu)獨(dú)立的方式來識(shí)別call以及return是不可能的。我們選擇了如下優(yōu)化來提高魯棒性:在架構(gòu)獨(dú)立的,能夠?qū)C(jī)器代碼轉(zhuǎn)換為TCG ops的qemu 代碼中,每當(dāng)遇到call和return時(shí),我們會(huì)通知代碼生成器。缺點(diǎn)就是針對(duì)每個(gè)target架構(gòu),類似的通知代碼都必須被插入到翻譯代碼中去,但這并不復(fù)雜。
評(píng) 價(jià)
詳見原文,主要是一些指標(biāo)與測(cè)試效果
未來工作
全系統(tǒng)仿真
SYMQEMU目前運(yùn)行符號(hào)執(zhí)行針對(duì)linux用戶態(tài)二進(jìn)制程序,之后將會(huì)對(duì)其拓展到全系統(tǒng)分析,尤其是針對(duì)嵌入式設(shè)備而言,分析此類程序要求全系統(tǒng)仿真。
我們認(rèn)為在SYMQEMU實(shí)現(xiàn)這一改進(jìn)是可能的。將target翻譯為TCG ops,對(duì)其插樁,并將其編譯為機(jī)器碼,這些基本過程不改變。需要添加的一個(gè)機(jī)制是將符號(hào)化數(shù)據(jù)引入到guest系統(tǒng)中,這是受到S2E fake-instruction技術(shù)的啟發(fā),以及當(dāng)在guest內(nèi)存以及符號(hào)表達(dá)式之間存在映射時(shí),shadow-memory系統(tǒng)需要記錄虛擬MMU的數(shù)量。最終將會(huì)產(chǎn)生一個(gè)不僅可以對(duì)用戶態(tài)程序進(jìn)行測(cè)試,同樣可以對(duì)內(nèi)核代碼進(jìn)行測(cè)試的系統(tǒng),并且其同樣可分析非linux系統(tǒng)的代碼以及裸固件等。
caching across executions
混合fuzzing技術(shù)的特點(diǎn)之一是能夠?qū)ν怀绦蜻M(jìn)行大量的連續(xù)執(zhí)行。作為動(dòng)態(tài)翻譯器,SYMQEMU在運(yùn)行態(tài)按需翻譯target程序。并且翻譯的結(jié)果在單個(gè)運(yùn)行的過程之中被緩存,但是當(dāng)目標(biāo)程序執(zhí)行終止時(shí)這些緩存結(jié)果會(huì)被丟棄。我們猜想,可以通過緩存多個(gè)執(zhí)行過程中的翻譯結(jié)果,可以顯著提升結(jié)合SYMQEMU的混合FUZZ的性能。主要的挑戰(zhàn)就是需要確定目標(biāo)是確定性加載的,以及針對(duì)自我修改代碼需要進(jìn)行特殊處理。所以,這些潛在的優(yōu)化性能提升主要在于被測(cè)程序的特點(diǎn)。
symbolic QEMU helpers
QEMU利用TCG ops表示機(jī)器碼,然而一些target的指令難以用TCG ops來進(jìn)行表示,尤其是在CISC架構(gòu)之上。針對(duì)這情況,QEMU使用helpers:可以被TCG調(diào)用的內(nèi)置變異函數(shù),仿真target架構(gòu)的每一個(gè)復(fù)雜指令。由于helpers工作在常規(guī)的TCG架構(gòu)之外,SYMQEMU在TCG層級(jí)的插樁不能插入符號(hào)處理到他們之中。這樣的結(jié)果是implicit concretization,在分析使用大量目標(biāo)的指令時(shí)會(huì)產(chǎn)生精讀損失。
我們有如下兩種實(shí)現(xiàn)qemu helpers符號(hào)處理的方式:
- 第一種方式是為每一個(gè)要求的helper手動(dòng)添加符號(hào)等價(jià)式,更像在一些符號(hào)執(zhí)行引擎中使用的常用libc功能的函數(shù)總結(jié)。這個(gè)方式非常容易實(shí)現(xiàn),但是不方便應(yīng)用于大數(shù)量的helpers中。
- 另一種方式是自動(dòng)化的實(shí)現(xiàn)helpers的符號(hào)化版本。為了實(shí)現(xiàn)這個(gè)目的,SYMCC可以被用來編譯符號(hào)化追蹤到helpers中,他的源代碼作為QEMU的一部分是公開的。最終得到的二進(jìn)制文件是和SYMQEMU兼容的,因?yàn)镾YMCC的使用相同的符號(hào)推理的后端。S2E也是使用類似的方式編譯helpers到KLEE中的解釋器中的LLVM bitcode。
相關(guān)工作
binary-only符號(hào)執(zhí)行
Mayhem是一個(gè)高性能的基于解釋器的符號(hào)執(zhí)行系統(tǒng),贏得過DAPRA CGC比賽,然而由于其不開源無法比較性能。Triton是可以以兩種方式運(yùn)行的符號(hào)執(zhí)行系統(tǒng),一種使用二進(jìn)制文件轉(zhuǎn)換,類似于QSYM,一種使用CPU仿真,類似于S2E以及angr。Eclipser覆蓋了介于fuzzing和符號(hào)執(zhí)行之間的一些中間區(qū)域,他認(rèn)為在分支條件和輸入數(shù)據(jù)之間存在線性關(guān)系。這種約束的簡(jiǎn)化提升了系統(tǒng)的性能,然而他卻不能發(fā)現(xiàn)常規(guī)符號(hào)執(zhí)行系統(tǒng)可以發(fā)現(xiàn)的那些路徑。Redqueen利用一種啟發(fā)式的方法尋找路徑條件和輸入之間的關(guān)系。SYMQEMU相比較來說實(shí)現(xiàn)了全系統(tǒng)仿真。
運(yùn)行態(tài)bug檢測(cè)
混合fuzzing依靠fuzzer以及sanitizers來檢測(cè)bugs。Address sanitizer是一種流行的用來檢測(cè)確定內(nèi)存錯(cuò)誤的sanitizer。由于其需要源代碼來產(chǎn)生插樁程序, Fioraldi et al設(shè)計(jì)了QASan,基于qemu的系統(tǒng)來對(duì)二進(jìn)制文件實(shí)現(xiàn)類似的檢測(cè)。有大量的需要源代碼的sanitizers。我們推測(cè)通過QASan的思路,可以將大量上述sanitizers用于二進(jìn)制文件分析。
混合fuzzing
Driller是基于angr的混合fuzzer,其設(shè)計(jì)理念類似于QSYM,但是有其angr的python實(shí)現(xiàn)以及基于解釋器的方式,其執(zhí)行速度較低。與QSYM以及SYMQEMU比較,它使用了一種更加精細(xì)的策略來融合fuzzer以及符號(hào)引擎:他監(jiān)控fuzzer的進(jìn)展情況,并且當(dāng)其似乎遇到自身無法解決的障礙時(shí),會(huì)自動(dòng)切換到符號(hào)執(zhí)行。類似的,最近提出的Pangolin通過不僅提供fuzzer測(cè)試用例,以及一些抽象的符號(hào)約束,還有快速樣本生成方法,強(qiáng)調(diào)了fuzzer結(jié)合符號(hào)執(zhí)行的優(yōu)勢(shì);利用這些,fuzzer能夠生成可以有很大概率解決由符號(hào)執(zhí)行生成的路徑約束的輸入。
我們認(rèn)為更加精細(xì)的符號(hào)執(zhí)行和fuzzer的組合可以很大程度上提升混合fuzzing的性能
總 結(jié)
我們提出了SYMQEMU,一種基于編譯的,針對(duì)二進(jìn)制文件的符號(hào)執(zhí)行引擎。我們的評(píng)價(jià)展示了SYMQEMU性能優(yōu)于最先進(jìn)的符號(hào)執(zhí)行引擎并且可以在某些方面與基于源代碼的符號(hào)執(zhí)行技術(shù)相匹配。而且SYMQEMU非常方便的向其他架構(gòu)進(jìn)行遷移,只需要幾行代碼即可。