匯編指令入門級(jí)整理-魔扣目錄

匯編指令入門級(jí)整理 | 原力計(jì)劃

作者 | AlbertS

出品 | CSDN 博客

前言

我們大都是被高級(jí)語言慣壞了的一代，源源不斷的新特性正在逐步添加到各類高級(jí)語言之中，匯編作為最接近機(jī)器指令的低級(jí)語言，已經(jīng)很少被直接拿來寫程序了，不過我還真的遇到了一個(gè)，那是之前的一個(gè)同事，因?yàn)樵趯懘a時(shí)遇到了成員函數(shù)權(quán)限及可見性的問題，導(dǎo)致他無法正確調(diào)用想執(zhí)行的函數(shù)，結(jié)果他就開始在 C++ 代碼里嵌入?yún)R編了，繞過了種種限制終于如愿以償，但是讀代碼的我們傻眼了…

因?yàn)轫?xiàng)目是跨平臺(tái)的，代碼推送的 linux 上編譯的時(shí)候他才發(fā)現(xiàn)，匯編代碼的語法在 Linux 和 windows 上居然是不一樣的，結(jié)果他又用一個(gè)判斷平臺(tái)的宏定義“完美”的解決了，最終這些代碼肯定是重寫了啊，因?yàn)榭勺x性太差了，最近在學(xué)習(xí)左值、右值、左引用和右引用的時(shí)候，總是有人用程序編譯生成的中間匯編代碼來解釋問題，看得我迷迷糊糊，所以決定熟悉一下簡單的匯編指令，邊學(xué)習(xí)邊記錄，方便今后忘記了可以直接拿來復(fù)習(xí)。

什么是匯編語言

匯編語言是最接近機(jī)器語言的編程語言，引用百科中的一段話解釋為：

匯編語言（assembly language）是一種用于電子計(jì)算機(jī)、微處理器、微控制器或其他可編程器件的低級(jí)語言，亦稱為符號(hào)語言。在匯編語言中，用助記符代替機(jī)器指令的操作碼，用地址符號(hào)或標(biāo)號(hào)代替指令或操作數(shù)的地址。匯編語言又被稱為第二代計(jì)算機(jī)語言。

匯編語言產(chǎn)生的原因

對于絕大多數(shù)人來說，二進(jìn)制程序是不可讀的，當(dāng)然有能人可以讀，比如第一代程序員，但這類人快滅絕了，直接看二進(jìn)制不容易看出來究竟做了什么事情，比如最簡單的加法指令二進(jìn)制表示為 00000011，如果它混在一大串01字符串中就很難把它找出來，所以匯編語言主要就是為了解決二進(jìn)制編碼的可讀性問題。

匯編與二進(jìn)制的關(guān)系

換句話來說，匯編語言就是把給機(jī)器看的二進(jìn)制編碼翻譯成人話，匯編指令是機(jī)器指令的助記符，與機(jī)器指令是一一對應(yīng)的關(guān)系，是一種便于閱讀和記憶的書寫格式。有效地解決了機(jī)器指令編寫程序難度大的問題，并且使用編譯器，可以很方便的把匯編程序轉(zhuǎn)譯成機(jī)器指令程序，比如之前提到的 00000011 加法指令，對應(yīng)的匯編指令是 ADD，在調(diào)用匯編器時(shí)就會(huì)把 ADD 翻譯成 00000011。

寄存器

說到匯編指令不得不提到寄存器，寄存器本身是用來存數(shù)據(jù)的，因?yàn)?CPU 本身只負(fù)責(zé)邏輯運(yùn)算，數(shù)據(jù)需要單獨(dú)儲(chǔ)存在其他的地方，但是對于不熟悉寄存器的人來說會(huì)有疑惑，數(shù)據(jù)不是存在硬盤上嗎？或者說數(shù)據(jù)不是存在內(nèi)存中嗎？這些想法都沒錯(cuò)，那么寄存器是用來做什么的呢？

寄存器作用

其實(shí)硬盤、內(nèi)存都是用來存儲(chǔ)數(shù)據(jù)的，但是 CPU 的運(yùn)算速度遠(yuǎn)高于內(nèi)存的讀寫速度，更不用說從硬盤上取數(shù)據(jù)了，所以為了避免被拖慢速度影響效率，CPU 都自帶一級(jí)緩存和二級(jí)緩存，一些 CPU 甚至增加了三級(jí)緩存，從這些緩存中讀寫數(shù)據(jù)要比內(nèi)存快很多，但是還是無法使用飛速運(yùn)轉(zhuǎn)的 CPU，所以才會(huì)有寄存器的存在。

寄存器不是后來增加的，在最初的計(jì)算中就已經(jīng)設(shè)計(jì)出來，相比而言，多級(jí)緩存出現(xiàn)的更晚一些，通常那些最頻繁讀寫的數(shù)據(jù)都會(huì)被放在寄存器里面，CPU 優(yōu)先讀寫寄存器，再通過寄存器、緩存跟內(nèi)存來交換數(shù)據(jù)，達(dá)到緩沖的目的，因?yàn)榭梢酝ㄟ^名稱訪問寄存器，這樣訪問速度是最快的，因此也被稱為零級(jí)緩存。

存取速度比較

通過上面的敘述我們可以知道存取速度從高到低分別是: 寄存器 > 1級(jí)緩存 > 2級(jí)緩存 > 3級(jí)緩存 > 內(nèi)存 > 硬盤，關(guān)于它們的存取速度，舉個(gè)例子很容易就能明白了，比如我們做菜（CPU工作）時(shí)，取手中（寄存器）正拿著的肉和蔬菜肯定是最快的，如果沒有就需要把案板上（1級(jí)緩存）處理好的菜拿過來，如果案板上沒有就在更遠(yuǎn)一點(diǎn)的洗菜池（2級(jí)緩存）中找一找，還沒找到的話就要到冰箱（3級(jí)緩存）中看一看了，這時(shí)發(fā)現(xiàn)家里真沒有，那去樓下的菜店（內(nèi)存）去買點(diǎn)吧，轉(zhuǎn)了一圈發(fā)現(xiàn)沒有想要的，最后還是開車去農(nóng)貿(mào)市場（硬盤）買吧。

通過上面這個(gè)例子應(yīng)該能明白它們的速度關(guān)系了，既然緩存這么快，為什么不用緩存代替內(nèi)存，或者將2、3級(jí)緩存都換成1級(jí)緩存呢？這里邊有一個(gè)成本問題，速度越快對應(yīng)著價(jià)格越高，如果你買過機(jī)械硬盤和固態(tài)硬盤應(yīng)該很容易就理解了。

寄存器分類

常用的 x86 CPU 寄存器有8個(gè)：EAX 、EBX、ECX、EDX、EDI、ESI、EBP、ESP，據(jù)說現(xiàn)在寄存器總數(shù)已經(jīng)超過100個(gè)了，等我找到相關(guān)資料再來補(bǔ)充，上面這幾個(gè)寄存器是最常用的，這些名字也常常出現(xiàn)在匯編的代碼中。

我們常說的32位、64位 CPU 是指數(shù)據(jù)總線的寬度或根數(shù)，而寄存器是暫存數(shù)據(jù)和中間結(jié)果的單元，因此寄存器的位數(shù)也就是處理數(shù)據(jù)的長度與數(shù)據(jù)總線的根數(shù)是相同的，所以32位 CPU 對應(yīng)的寄存器也應(yīng)該是32位的。

常用寄存器用途

上面提到大8個(gè)寄存器都有其特定的用途，我們以32位 CPU 為例簡單說明下這些寄存器的作用，整理如下表：

寄存器EAX、AX、AH、AL的關(guān)系

在上面的圖標(biāo)中每個(gè)常用寄存器后面還有其他的名字，它們是同一個(gè)寄存器不同用法下的不同名字，比如在32位 CPU 上，EAX是32位的寄存器，而AX是EAX的低16位，AH是AX的高8位，而AL是AX的低8位，它們的對照關(guān)系如下：

00000000 00000000 00000000 00000000
|===============EAX===============|---4個(gè)字節(jié)
|======AX=======|---2個(gè)字節(jié)
|==AH===|-----------1個(gè)字節(jié)
|===AL==|---1個(gè)字節(jié)

匯編語言指令

終于說到匯編常用指令了，因?yàn)?linux 和 windows 下的匯編語法是有些不同的，所以下面我們先通過 windows 下的匯編指令來簡單學(xué)習(xí)一下，后續(xù)再來比較兩者的不同。

數(shù)據(jù)傳送指令

算術(shù)運(yùn)算指令

邏輯運(yùn)算指令

循環(huán)控制指令

轉(zhuǎn)移指令

Linux 和 windows 下匯編的區(qū)別

前面說到 linux 和 windows 下的匯編語法是不同的，其實(shí)兩種語法的不同和系統(tǒng)不同沒有絕對的關(guān)系，一般在 linux 上會(huì)使用 gcc/g++ 編譯器，而在 windows 上會(huì)使用微軟的 cl 也就是 MSBUILD，所以產(chǎn)生不同的代碼是因?yàn)榫幾g器不同，gcc 下采用的是AT&T的匯編語法格式，MSBUILD 采用的是Intel匯編語法格式。