什么是棧

簡(jiǎn)單來(lái)說(shuō)，棧是一種 LIFO（Last In Frist Out，后進(jìn)先出）形式的數(shù)據(jù)結(jié)構(gòu)。棧一般是從高地址向低地址增長(zhǎng)，并且棧支持 push（入棧）和 pop（出棧）兩個(gè)操作。如下圖所示：

push 操作先將棧頂（sp指針）向下移動(dòng)一個(gè)位置，然后將數(shù)據(jù)寫(xiě)入到新的棧頂；而 pop 操作會(huì)從棧頂讀取數(shù)據(jù)，并且將棧頂（sp指針）向上移動(dòng)一個(gè)位置。
例如，將 0x100 壓入棧，過(guò)程如下圖所示：

我們?cè)賮?lái)看看出棧操作，如下圖所示：

更多l(xiāng)inux內(nèi)核視頻教程文檔資料免費(fèi)領(lǐng)取后臺(tái)私信【內(nèi)核】自行獲取.

Linux內(nèi)核源碼/內(nèi)存調(diào)優(yōu)/文件系統(tǒng)/進(jìn)程管理/設(shè)備驅(qū)動(dòng)/網(wǎng)絡(luò)協(xié)議棧-學(xué)習(xí)視頻教程-騰訊課堂

棧幀

棧幀，也就是 Sack Frame，其本質(zhì)就是一種棧，只是這種棧專(zhuān)門(mén)用于保存函數(shù)調(diào)用過(guò)程中的各種信息（參數(shù)，返回地址，本地變量等）。
棧幀有棧頂和棧底之分，其中棧頂?shù)牡刂纷畹停瑮５椎牡刂纷罡摺P(棧指針) 就是一直指向棧頂?shù)摹Ｔ?x86 的 32 位 CPU 中，我們用 %ebp 寄存器指向棧底，也就是基址指針；用 %esp 寄存器指向棧頂，也就是棧指針。下面是一個(gè)棧幀的示意圖：

一般來(lái)說(shuō)，我們將 %ebp 到 %esp 之間區(qū)域當(dāng)做棧幀。并不是整個(gè)棧空間只有一個(gè)棧幀，每調(diào)用一個(gè)函數(shù)，就會(huì)生成一個(gè)新的棧幀。
在函數(shù)調(diào)用過(guò)程中，我們將調(diào)用函數(shù)的函數(shù)稱(chēng)為：調(diào)用者(caller)，將被調(diào)用的函數(shù)稱(chēng)為：被調(diào)用者(callee)。在這個(gè)過(guò)程中：

調(diào)用者需要知道在哪里獲取被調(diào)用者返回的值（一般存放到 %eax 寄存器）。
被調(diào)用者需要知道傳入的參數(shù)在哪里和調(diào)用完后的返回地址在哪里。
我們需要保證在被調(diào)用者返回后，%ebp 和 %esp 寄存器的值應(yīng)該和調(diào)用前一致。

函數(shù)調(diào)用

現(xiàn)在，我們來(lái)看看函數(shù)調(diào)用時(shí)，棧幀是如何變化的。
我們以一個(gè)函數(shù)調(diào)用的實(shí)例來(lái)解說(shuō)，代碼如下：

// stack.c

int add_func(int a, int b)
{
    int c, d;

    c = a;
    d = b;

    return c + d;
}

int main(int argc, char *argv[])
{
    int total;

    total = add_func(1, 2);

    return 0;
}

我們使用命令 gcc -S -m32 stack.c 來(lái)編譯上面的代碼，獲取的匯編代碼如下所示（去掉一些無(wú)關(guān)緊要的信息）：

add_func:
    pushl   %ebp                // 保存ebp寄存器到棧
    movl    %esp, %ebp          // 把ebp進(jìn)程設(shè)置為esp的值
    subl    $16, %esp           // 為局部變量申請(qǐng)空間
    movl    8(%ebp), %eax       // 把參數(shù)a保存到eax寄存器中
    movl    %eax, -8(%ebp)      // 把eax寄存器的值保存到局部變量c中（c = a）
    movl    12(%ebp), %eax      // 把參數(shù)b保存到eax寄存器中
    movl    %eax, -4(%ebp)      // 把eax寄存器到值保存到局部變量d中（d = b）
    movl    -8(%ebp), %edx      // 把d的值保存到edx寄存器中
    movl    -4(%ebp), %eax      // 把c的值保存到eax寄存器中
    addl    %edx, %eax          // 將eax寄存器與edx寄存器的值相加，保存到eax中（返回值）
    leave
    ret                         // 函數(shù)返回
    ...

可能匯編代碼比較難看懂，我們用下面的插圖來(lái)說(shuō)明這個(gè)調(diào)用過(guò)程：

如上圖所示，調(diào)用過(guò)程如下：

在 main() 函數(shù)調(diào)用 add_func() 函數(shù)前，先將調(diào)用 add_func() 函數(shù)的參數(shù)壓棧。
在調(diào)用 add_func() 函數(shù)時(shí)，會(huì)將返回地址壓棧，接著進(jìn)入 add_func() 函數(shù)。
add_func() 函數(shù)執(zhí)行時(shí)，會(huì)將原來(lái)的 ebp寄存器的值壓棧，然后把 ebp寄存器的設(shè)置為 esp寄存器的值。
接著 add_func() 函數(shù)會(huì)為局部變量申請(qǐng)空間，也就是將 esp寄存器向下移動(dòng)。
然后把局部變量 c 設(shè)置為參數(shù) a 的值，局部變量 d 設(shè)置為參數(shù) b 的值。
最后將局部變量 c 和 d 的值相加，放置到 eax寄存器中（C語(yǔ)言規(guī)定以 eax寄存器傳遞返回值），然后調(diào)用 ret 指令返回到 main() 函數(shù)。

函數(shù)返回

上面介紹了函數(shù)調(diào)用的過(guò)程，現(xiàn)在我們來(lái)介紹一下函數(shù)調(diào)用完畢后，從被調(diào)用函數(shù)返回到原來(lái)的函數(shù)過(guò)程是如何處理的。
從 add_func() 函數(shù)的匯編代碼可以看到，當(dāng)被調(diào)用函數(shù)執(zhí)行完畢返回到調(diào)用函數(shù)前，會(huì)執(zhí)行 leave 指令，這條指令等價(jià)于：

movl %ebp, %esp
popl %ebp

這兩條匯編指令的意思是，將 esp寄存器和 ebp寄存器恢復(fù)到調(diào)用函數(shù)前的值。
然后，調(diào)用 ret 指令返回到原來(lái)的函數(shù)。ret 指令會(huì)從棧頂獲取返回地址，然后跳轉(zhuǎn)到（jmp指令）此地址繼續(xù)執(zhí)行。這時(shí)的棧幀的結(jié)構(gòu)如下圖所示：

棧溢出攻擊

前面說(shuō)了那么，都是為了棧溢出攻擊這節(jié)作鋪墊的。通過(guò)前面的學(xué)習(xí)，我們知道調(diào)用函數(shù)的參數(shù) 、執(zhí)行完函數(shù)后的返回地址和被調(diào)用函數(shù)的局部變量都是存放在棧中的。
如果在調(diào)用函數(shù)時(shí)，不小心將返回地址覆蓋了，那么調(diào)用完函數(shù)后，將不會(huì)跳轉(zhuǎn)到原來(lái)的函數(shù)繼續(xù)執(zhí)行，而是跳轉(zhuǎn)到覆蓋后的地址執(zhí)行。如下圖所示：

那么，怎樣才能把返回地址覆蓋呢？我們可以通過(guò)下面的例子來(lái)說(shuō)明：

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdint.h>

#define PTR_SIZE 8   // 指針的大小
#define EBP_SIZE 8   // ebp寄存器的大小

void inject_callback()
{
    printf("inject_callback called...n");
    exit(0);
}

void func_call(char *addr, int len)
{
    char tmpBuf[16] = {0xff};

    memcpy(tmpBuf + 16 + EBP_SIZE, addr, len);

    printf("func_call called...n");
}

int main(int argc, char** argv)
{
    uint64_t injectPtr = (uint64_t)&inject_callback;

    func_call(&injectPtr, PTR_SIZE);

    printf("main exited...n");

    return 0;
}

我們使用以下命令編譯上面代碼，并且執(zhí)行：

$ gcc stack-overflow.c -fno-stack-protector -o stack-overflow
$ ./stack-overflow
func_call called...
inject_callback called...

在編譯上面程序時(shí)，一定要加上 -fno-stack-protector 參數(shù)，否則將會(huì)觸發(fā)棧溢出保護(hù)，導(dǎo)致執(zhí)行失敗。

在上面的代碼中，我們并沒(méi)有直接調(diào)用 inject_callback() 函數(shù)，而是通過(guò)把 inject_callback() 函數(shù)的地址復(fù)制到 func_call() 函數(shù)的局部變量 tmpBuf 中。
由于局部變量 tmpBuf 的類(lèi)型為字符串?dāng)?shù)組，而且大小為 16 個(gè)字節(jié)。但我們復(fù)制數(shù)據(jù)是從 24（16 + 8）處開(kāi)始復(fù)制，已經(jīng)超出了局部變量 tmpBuf 的大小，如下圖所示：

從上圖可以看出，func_call() 函數(shù)在調(diào)用 memcpy() 函數(shù)復(fù)制數(shù)據(jù)時(shí)，由于不小心用 inject_callback() 函數(shù)的地址覆蓋了返回地址，導(dǎo)致 func_call() 函數(shù)執(zhí)行完畢后，跳轉(zhuǎn)到 inject_callback() 函數(shù)處執(zhí)行。
這就是棧溢出攻擊的原理，而導(dǎo)致棧溢出攻擊的原因就是：調(diào)用 memcpy()、strcpy() 等函數(shù)復(fù)制數(shù)據(jù)時(shí)，沒(méi)有對(duì)數(shù)據(jù)的長(zhǎng)度進(jìn)行驗(yàn)證，從而返回地址被復(fù)制的數(shù)據(jù)覆蓋了。
黑客可以利用棧溢出攻擊來(lái)把函數(shù)的返回地址修改成入侵代碼的地址，從而實(shí)現(xiàn)攻擊的目的。