作為過(guò)來(lái)人,我發(fā)現(xiàn)很多程序猿新手,在編寫(xiě)代碼的時(shí)候,特別喜歡定義很多獨(dú)立的全局變量,而不是把這些變量封裝到一個(gè)結(jié)構(gòu)體中,主要原因是圖方便,但是要知道,這其實(shí)是一個(gè)不好的習(xí)慣,而且會(huì)降低整體代碼的性能。
另一方面,最近有幸與ARM公司的大神【裸機(jī)思維】的傻孩子交流的時(shí)候,他聊到:“其實(shí)Cortex在架構(gòu)層面就是更偏好面向?qū)ο蟮模呐履阒皇鞘褂昧私Y(jié)構(gòu)體),其表現(xiàn)形式就是:Cortex所有的尋址模式都是間接尋址——換句話(huà)說(shuō)一定依賴(lài)一個(gè)寄存器作為基地址。
舉例來(lái)說(shuō),同樣是訪(fǎng)問(wèn)外設(shè)寄存器,過(guò)去在8位和16位機(jī)時(shí)代,人們喜歡給每一個(gè)寄存器都單獨(dú)綁定地址——當(dāng)作全局變量來(lái)訪(fǎng)問(wèn),而現(xiàn)在Cortex在架構(gòu)上更鼓勵(lì)底層驅(qū)動(dòng)以寄存器頁(yè)(也就是結(jié)構(gòu)體)為單位來(lái)定義寄存器,這也就是說(shuō),同一個(gè)外設(shè)的寄存器是借助擁有同一個(gè)基地址的結(jié)構(gòu)體來(lái)訪(fǎng)問(wèn)的。”
以Cortex A9架構(gòu)為前提,下面一口君詳細(xì)給你解釋為什么使用結(jié)構(gòu)體效率會(huì)更高一些。
一、全局變量反匯編
1. 源文件
gcd.s
.text
.global _start
_start:
ldr sp,=0x70000000 /*get stack top pointer*/
b main
main.c
/*
* main.c
*
* Created on: 2020-12-12
* Author: pengdan
*/
int xx=0;
int yy=0;
int zz=0;
int main(void)
{
xx=0x11;
yy=0x22;
zz=0x33;
while(1);
return 0;
}
map.lds
OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm")
/*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS
{
. = 0x40008000;
. = ALIGN(4);
.text :
{
gcd.o(.text)
*(.text)
}
. = ALIGN(4);
.rodata :
{ *(.rodata) }
. = ALIGN(4);
.data :
{ *(.data) }
. = ALIGN(4);
.bss :
{ *(.bss) }
}
Makefile
TARGET=gcd
TARGETC=main
all:
arm-none-linux-gnueabi-gcc -O1 -g -c -o $(TARGETC).o $(TARGETC).c
arm-none-linux-gnueabi-gcc -O1 -g -c -o $(TARGET).o $(TARGET).s
arm-none-linux-gnueabi-gcc -O1 -g -S -o $(TARGETC).s $(TARGETC).c
arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Tmap.lds -o $(TARGET).elf
arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin
arm-none-linux-gnueabi-objdump -D $(TARGET).elf > $(TARGET).dis
clean:
rm -rf *.o *.elf *.dis *.bin
【交叉編譯工具,自行搜索安裝】
2. 反匯編結(jié)果:

由上圖可知,每存儲(chǔ)1個(gè)int型全局變量需要8個(gè)字節(jié),
literal pool (文字池)占用4個(gè)字節(jié)
literal pool的本質(zhì)就是ARM匯編語(yǔ)言代碼節(jié)中的一塊用來(lái)存放常量數(shù)據(jù)而非可執(zhí)行代碼的內(nèi)存塊。

使用literal pool (文字池)的原因
當(dāng)想要在一條指令中使用一個(gè) 4字節(jié)長(zhǎng)度的常量數(shù)據(jù)(這個(gè)數(shù)據(jù)可以是內(nèi)存地址,也可以是數(shù)字常量)
的時(shí)候,由于ARM指令集是定長(zhǎng)的(ARM指令4字節(jié)或Thumb指令2字節(jié)),所以就無(wú)法把這個(gè)4字節(jié)
的常量數(shù)據(jù)編碼在一條編譯后的指令中。此時(shí),ARM編譯器(編譯C源程序)/匯編器(編譯匯編程序)
就會(huì)在代碼節(jié)中分配一塊內(nèi)存,并把這個(gè)4字節(jié)的數(shù)據(jù)常量保存于此,之后,再使用一條指令把這個(gè)4 字
節(jié)的數(shù)字常量加載到寄存器中參與運(yùn)算。
在C源代碼中,文字池的分配是由編譯器在編譯時(shí)自行安排的,在進(jìn)行匯編程序設(shè)計(jì)時(shí),開(kāi)發(fā)者可以自己
進(jìn)行文字池的分配,如果開(kāi)發(fā)者沒(méi)有進(jìn)行文字池的安排,那么匯編器就會(huì)代勞。
bss段占用4個(gè)字節(jié)

每訪(fǎng)問(wèn)1次全局變量,總共需要3條指令,訪(fǎng)問(wèn)3次全局變量用了12條指令。

14. 通過(guò)當(dāng)前pc值40008018偏移32個(gè)字節(jié),找到xx變量的鏈接地址40008038,然后取出其內(nèi)容40008044存放在r3中,該值就是xx在bss段的地址
15. 通過(guò)將立即數(shù)0x11即#17賦值給r2
16. 將r2的內(nèi)讓那個(gè)寫(xiě)入到r3對(duì)應(yīng)的指向的內(nèi)存,即xx標(biāo)號(hào)對(duì)應(yīng)的內(nèi)存中
二、結(jié)構(gòu)體反匯編
1. 修改main.c如下:
/*
2 * main.c
3 *
4 * Created on: 2020-12-12
5 * Author: 一口Linux
6 */
7 struct
8 {
9 int xx;
10 int yy;
11 int zz;
12 }peng;
13 int main(void)
14 {
15 peng.xx=0x11;
16 peng.yy=0x22;
17 peng.zz=0x33;
18
19 while(1);
20 return 0;
21 }
2. 反匯編代碼如下:

由上圖可知:
- 結(jié)構(gòu)體變量peng位于bss段,地址是4000802c
- 訪(fǎng)問(wèn)結(jié)構(gòu)體成員也需要利用pc找到結(jié)構(gòu)體變量peng對(duì)應(yīng)的文字池中地址40008028,然后間接找到結(jié)構(gòu)體變量peng地址4000802c
與定義成3個(gè)全局變量相比,優(yōu)點(diǎn):
- 結(jié)構(gòu)體的所有成員在literal pool 中共用同一個(gè)地址;而每一個(gè)全局變量在literal pool 中都有一個(gè)地址,節(jié)省了8個(gè)字節(jié)。
- 訪(fǎng)問(wèn)結(jié)構(gòu)體其他成員的時(shí)候,不需要再次裝載基地址,只需要2條指令即可實(shí)現(xiàn)賦值;訪(fǎng)問(wèn)3個(gè)成員,總共需要7條指令,節(jié)省了5條指令
彩!
所以對(duì)于需要大量訪(fǎng)問(wèn)結(jié)構(gòu)體成員的功能函數(shù),所有訪(fǎng)問(wèn)結(jié)構(gòu)體成員的操作只需要加載一次基地址即可。
使用結(jié)構(gòu)體就可以大大的節(jié)省指令周期,而節(jié)省指令周期對(duì)于提高cpu的運(yùn)行效率自然不言而喻。
所以,重要問(wèn)題說(shuō)3遍
盡量使用結(jié)構(gòu)體 盡量使用結(jié)構(gòu)體 盡量使用結(jié)構(gòu)體
三、繼續(xù)優(yōu)化
那么指令還能不能更少一點(diǎn)呢? 答案是可以的, 修改Makefile如下:
TARGET=gcd
TARGETC=main
all:
arm-none-linux-gnueabi-gcc -Os -lto -g -c -o $(TARGETC).o $(TARGETC).c
arm-none-linux-gnueabi-gcc -Os -lto -g -c -o $(TARGET).o $(TARGET).s
arm-none-linux-gnueabi-gcc -Os -lto -g -S -o $(TARGETC).s $(TARGETC).c
arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Tmap.lds -o $(TARGET).elf
arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin
arm-none-linux-gnueabi-objdump -D $(TARGET).elf > $(TARGET).dis
clean:
rm -rf *.o *.elf *.dis *.bin
仍然用第二章的main.c文件

執(zhí)行結(jié)果
可以看到代碼已經(jīng)被優(yōu)化到5條。
14. 把peng的地址40008024裝載到r3中
15. r0寫(xiě)入立即數(shù)0x11
16. r1寫(xiě)入立即數(shù)0x22
17. r0寫(xiě)入立即數(shù)0x33
18. 通過(guò)stm指令將r0、r1、r2的值順序?qū)懭氲?0008024內(nèi)存中