日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

本系列分三篇,用破玩意的方式徹底理解好指針的本質:

 

  • 你管這破玩意叫指針 -- 基礎篇
  • 你管這破玩意叫指針 -- 進階篇
  • 你管這破玩意叫指針 -- 變態篇

 

話不多說,開始!

內存,通常被嚴謹地畫成下面這個樣子,一個下方是低地址上方是高地址的格子樓。


 

但我今天換種畫法,畫成下面這個樣子。


 

每個格子代表內存中的 1 個字節(8 位),格子上的數字就代表內存地址,我也直接用 10 進制來表示了,免得 16 進制又算不明白了。

目前內存是完全空的,格子里沒有任何內容。

試想一下,如果你忘掉所有的語法規則和編程規范,你會如何描述對這些內存格子的操作呢?

一、類型系統

很簡單,往格子 3 處放個數字 29,往格子 6 處放個數字 38,就這么簡單直接地描述即可。


 

但是這樣說話太麻煩了,什么往格子 3 處放個數字 29 的,廢話太多,也不方便不講感情的計算機去理解。

那我們就定個指令,使用 mov $x, (y) 表示把數字 x 放入格子 y,如下:

mov $29, (3)
mov $38, (6)

這就表示剛剛說的:

把數字 29 放入內存格子 3
把數字 38 放入內存格子 6

是不是太簡單了?別急,好戲馬上開始!

如果要把數字 999 放入內存格子 8,該怎么辦呢?

由于 1 個格子表示 1 個字節,只有 8 位,因此只能表示 256 個數字,要么是有符號的 -128 ~ 127,要么是無符號的 0 ~255,顯然數字 999 無法放在 1 個格子內,只能占用 2 個格子了。

那也好辦,就這么說,把數字 999 放入格子 8,連續占用兩個格子。


 

但這樣,我們剛剛的 mov 指令就得改改了,不但要表示"存放"這個含義,還得表示占用了多少個格子。

我們用 movb 表示只占 1 個字節,用 movw 表示占用 2 個字節。那么,剛剛的三個數字,就分別可以這樣用指令來表示了:

movb $29, (3)
movb $38, (6)
movw $999, (8)

含義就是:

把數字 29 放入內存格子 3,占 1 個字節
把數字 38 放入內存格子 6,占 1 個字節
把數字 999 放入內存格子 8,占 2 個字節

OK,既然有了 1 字節和 2 字節的的指令,不妨再設計下,用 movl 表示 4 字節,movq 表示 8 字節 ...

movb 占用 1 字節
movw 占用 2 字節
movl 占用 4 字節
movq 占用 8 字節

不知不覺,類型系統就被你悄悄設計出來了!當然,雖然這只是個半成品。

二、變量

你不斷地往不同格子里放數據。

比如我把我的年齡放在 11 號格子(占 1 字節),把我的月薪放在 14 號格子(占 4 字節)。


 

現在我們的內存已經非?;靵y了,你根本記不住原來的 3 號格子放的數據表示什么,11 號格子又表示什么,只能通過看數字知道 14 號格子里放的確實是我的月薪。這該怎么辦呢?

增加一層抽象嘛!我們給這些放了我們數據的格子,都貼上個標簽,就可以不用再記那些無意義的格子編號了。


 

這樣以來,其實我們也不再關心,這些標簽到底在哪個格子里,只要給我找到格子把我的數據放進去就可以了。

movb $29, a
movb $38, b
movw $999, c
movb $18, age
movl $2147483647, salary

當然,我還需要再通過這個標簽,把我剛剛放進去的數據找出來。

這很簡單,但存在一個問題,放進去的時候,我們可以通過 movb,movw,movl 等知道占用多少個格子。而取出來的時候,標簽上可沒有寫這個數據占用了多少個格子,這是有問題的。

因此,在定義這個標簽時,不能光取個名字,還需要有個信息就是,這個標簽對應的數據,占了多少個格子。

我們就效仿剛剛的存放操作,也規定一系列單詞,來修飾這些標簽,表示占用了多少個格子。

char 表示 1 個字節,short 表示 2 個字節,int 表示 4 個字節,long 表示 8 個字節 ...


 

于是乎剛剛的 5 個數據,就可以表示為如下指令:

char a = 29;
char b = 38;
short c = 999;
char age = 18;
int salary = 2147483647;

行了,我也別藏著掖著了,相信大家也知道,這里就是 C 語言的寫法,而剛剛那堆 mov 是匯編語言的寫法。

這些 char a,char b,int salary 等,就是變量!記住,變量不但要有名字,還得有類型!

三、變量定義與賦值

其實,剛剛的寫法,是把變量的定義與賦值操作寫在一行了。

比如有如下語句:

int a = 1;

實際上是分成兩步的:

// 變量的定義
int a;
// 變量的賦值(此處也可以叫變量的初始化)
a = 1;

其中變量的定義是為了方便程序員后面去用它,這部分不是給 CPU 看的。


 

而變量的賦值才是真正在內存中把數據放進去,這部分才真正涉及 CPU 具體指令的執行。


 

也就是說,如果你僅僅定義了一個變量 int a; 但是沒有給它初始化的賦值操作,那么最終在 CPU 執行指令的時候,這個定義根本就沒有任何體現。

四、指針

現在,讓我們把內存清空,回到一開始的那一片凈土上。


 

我們來搞點花樣。我將我的密碼(1234)存儲在一個 short a 中,假設這個變量 a 被放在了 6 號格子處。


 

同時,我將這個變量 a 的地址,也就是 6 這個數字,存儲在另一個變量 int p 中,假設這個變量 p 被放在了 1 號格子處。


 

這樣,我尋找我密碼的方式,就是先通過 p 所在的內存地址找到里面存的值,也就是 a 的內存地址 6,再通過 a 的內存地址找到里面存的值,也就是我要找的密碼 1234。

我們可以用下面的代碼來表示剛剛的存放邏輯。

short a = 1234;
// 假設 a 被放在了 6 號格子處
int p = 6;

這里的 p 和 a 都是變量,只不過,p 這個變量有點特殊,它里面存放的值是一個內存地址,我們把 p 這個變量形象地成為指針變量,簡稱指針。

不過,這樣有幾個問題,我一個個來說。

1. 取地址

首先,我們在編碼階段,無法知道也無需知道變量 a 會存放在哪里,不然就失去了標簽的含義,又回到了需要關心具體的內存地址(也就是格子編號)的時代了。

所以,我們應該有個方法,來在編碼階段表示變量 a 的地址的含義,姑且就叫做 &a 吧。

那么我們的代碼,就可以優化為:

short a = 1234;
// 假設 a 的地址是 6
// 那么下面的 p 就等于 6
int p = &a;

用圖來表示就是:


 

2. 指針變量本身的大小

視角放到這個變量 p 身上,雖然本質上這個變量 p 里面存放的就是一個數值,假設是 6,但是它卻表示了一個內存地址的值。

如果讓程序員隨便規定這個變量 p 的數據類型(也就是占多少個字節),那顯然容易出問題。

比如內存地址是 999,那么我用一個 char 類型的變量 p 來存放它,就會有問題。

我們在編碼階段是無法確定一個變量的內存地址是多少的,所以用什么類型的變量來存放它,也是無法判斷的。

所以,最穩妥的辦法就是,用一個完全能容納所有內存地址范圍的變量類型來存放指針變量。

我們姑且認為我們是在一個 32 位的系統上,那么用一個 4 字節大小的變量來存放,就可以了。(當然,實際上這取決于你的編譯器的位數)

現在,我們的指針變量所占用的內存大小,就是固定的 4 個字節,也就是 4 個格子。

程序員無需也無法修改這個大小,那么我們就可以把 p 前面的數據類型去掉了。

short a = 1234;
p = &a;

3. 指針變量的類型

剛剛我們解決了指針變量本身所占用的內存大小,但是還有一個問題沒有解決,就是指針變量里存放的內存地址處的變量的大小。

也就是說,上面的指針變量 p 里雖然存放了變量 a 的內存地址 6,但是指針變量 p 卻沒有任何信息,來說明內存地址 6 處的變量,它的大小是多少。

假如,我們認為內存地址 6 處的變量是個 char 類型,也就是只占用了一個字節,那么顯然,會取出一個不符合預期的值。


 

當然,如果認為 6 處的變量是個 int 類型,占 4 個字節,雖然數值上可能沒有問題,但從某種程度上講也是不太符合預期的(假如 8 號和 9 號格子里有其他內容,那就更不符合預期了)。


 

所以,必須得完全按照變量本身的類型,也就是 short 類型來讀取此內存地址處的值,才是正確的。

那我們應該如何表示這個信息呢?即如何表示,變量 p 是一個指針,且這個指針里面存放的內存地址處的變量的類型是 short。

很好辦,直接說答案吧。

short a = 1234;
short * p = &a;

p 前面的 * 表示變量 p 是一個指針類型,再前面的 short 表示該指針指向的內存地址處的變量,是個 short 類型的變量。

當然,更準確的說法是,指針 p 將會按照 short 類型的變量來讀取它指向的內存,至于那里到底是什么,無所謂。


 

注意哦,這個 short 并不是表示指針變量本身的大小占 2 個字節,指針變量本身我們前面說過了,就是固定的 4 字節大小。

不過總是這樣說太繞口了,今后我們就說,變量 p 是個 short * 類型的指針,就可以了。

用上面的圖形象地說就是,右邊變量 a 藍色的填充,表示 a 是個 short 類型,而外面的虛線框框,表示指針 p 按照 short 類型的變量來"解讀"內存地址 6 處的數值。

兩者相匹配了,就是"正確"的編程代碼了。

當然,這里的"正確",是說給程序員聽的,CPU 才不關心。

4. 指針所指向的值

上面我們已經可以獲得某個變量的地址,比如獲取 a 的地址就是:

&a

同時我們也可以定義一個指針變量,比如定義一個 short * 類型的指針變量 p:

short * p;

并且,我們通過直接賦值操作,可以給指針變量進行初始化:

p = &a;

當然,上面的代碼也可以連起來寫,即指針變量 p 的定義與初始化寫在同一行:

short * p = &a;

不過,我們還沒有一個方法,來表示指針變量 p 所指向的那塊內存。

那我們就發明一個,比如想把 p 所指向的那塊內存的值改為 999,可以這樣寫。

*p = 999;

這里的 * 就表示"指向"的含義,即 *p 不是說 p 這個變量的內存地址,而是把 p 這個變量里存的內容當做內存地址來看,指向這個內存地址。

用圖表示就是:


 

所以連起來一個完整的程序就是:

short a = 1234;
// 指針的定義
short * p;
// 指針的初始化,也即指針變量本身的值
p = &a;
// 指針變量所指向的內存地址的值
*p = 999;

執行過后,a 的值會變成 999,或者說 6 號格子與 7 號格子里的值會變成 999。

5. 指針的加減

如果對一個普通變量 +1,比如說:

int a = 1;
int b = a + 1;

那顯然,b 的值應該是 2,毫無疑問。

但是如果對一個指針變量 +1,會怎么樣呢?

int a = 1;
int *p = &a;
int *p2 = p + 1;

我們假設變量 a 放在了格子 1 處。

變量 a 的值是什么,以及變量 p 被放在了哪里,我們都不關心,就只盯著 p 的值看,顯然,一開始的時候是 1。

(為方便演示,下面的圖直接表示 p 所指向的內存地址,而不是 p 本身所在的內存地址)


 

我們先不考慮,p + 1 應該是幾,如果讓你來設計這個語言,你覺得 p + 1 是幾比較好呢?

我認為,只有兩種較為合理的設計。

第一種,p + 1 就等于 2,就簡簡單單當做數值進行加法運算而已。


 

第二種,p + 1 等于 5,即跨過一個 p 所指向的內存單元的數據類型的大小,也就是 4 字節的 int。


 

你覺得那種比較合理呢?

那顯然是第二種嘛!不然和普通變量有啥區別了,你既然設計出了指針變量這個玩意,就需要讓它發揮點方便程序員的作用,這才是你設計它的真正目的。

當然你不服,你就想讓這個 int * 類型的指針變量,就真真正正在數值上只 +1,也就是讓 p 等于 2,該怎么辦呢?

很簡單,分成三步就好了:

第一步,把 int * 類型的 p 強轉為 char * 類型的 p。


 

第二步,p + 1。


 

第三步,再把 char * 類型的 p 強轉為 int * 類型。


 

完事!用代碼表示就是:

p = (int *)((char *)p + 1);

你會看到,C 語言項目中經常使用這樣的玩法。

當然,你這一頓花里胡哨的操作,在 CPU 眼里,就是對一個內存地址處的值簡簡單單地 +1 而已。

五、指針的本質

我們看上面的一張圖:


 

其實,別看上面又 short * p 又 short a 的,這是給程序員和編譯器看的。

在 CPU 眼里,根本沒有這些眼花繚亂的標簽,以及五花八門的解讀,就是 0 ~ 4 號格子里存了個數字 6,然后 6 ~ 7 號格子里存了個數字 1234,僅此而已。

更進一步講,其實就只是 1 號格子里存儲了數字 6(234 號格子是空的),6 號格子里存儲了數字 12,7 號格子里存儲了數字 34。


 

(當然實際得轉換成二進制,再結合大端序還是小端序來看哈,我這里就是簡單直觀告訴大家 CPU 才不管那么多,就一個格子一個格子的放數字就完事了)

所以,我們經常聽書上講,讓大家一定要記住,指針變量中只能存放地址,不要將一個整數或任何其他非地址類型的數據賦給一個指針變量了。

這種說法就非常別扭,很多書上,即想講清楚指針的本質,又想講清楚指針的注意事項,混雜在一起,讓讀者即沒有搞清楚指針的本質,又不知道指針的注意事項。

真糾結!

說實話,就光看書而沒有經過大量 C 語言的實踐,誰能記得住或者理解透徹那些注意事項。而經過大量 C 語言實踐的人,指針早就融入進血液中了,誰還來看你講指針的本質?所以說,這塊我覺得非常之矛盾。

實際上,指針變量的本質和普通變量是一樣的:

普通變量,寫個 short a,是在告訴編譯器,當我 a = 1 時,你給我找到一塊 2 字節的內存,把 1 填充進去。

指針變量,寫個 short * p,是在告訴編譯器兩件事情:

當我 p = xxx 時,你給我找到一塊 4 字節的內存(我們假設指針本身的大小固定 4 字節),把 xxx 填充進去,這就和普通變量完全一樣;

當我 *p = yyy 時,你給我找到 xxx 內存地址,并且按照 short 類型也就是 2 字節大小,把 yyy 填充到這里。


 

所以,誰說不能把一個整型變量賦給指針了,我這不就把一個整型變量 xxx 賦給指針 p 了么,我賦值的時候就說它是整型變量了,怎么的吧?

但是我用它的時候,我 *p 又把 xxx 看做是一個內存地址了,就去找內存 xxx 的地方,又怎么的吧?

用代碼來表示就是:

我強行把一個整型數值 6 賦值給指針變量 p,然后 *p 去訪問內存地址 6 并修改那個地方的值:

int * p = 6;
*p = 999;

我還可以把一個地址值,強行賦值給一個普通變量:

int a = 1;
int b = &a;

這時普通變量 b 里面存儲著 a 的地址,我 *b 也同樣可以訪問到 a 并修改它的值:

*b = 999;

當然如果你真這么寫編譯器會報錯,但沒關系,我們可以先把普通變量 b 強轉為指針變量,然后再 * 它:

*(int *)b = 999;

你還可以玩些更花哨的,先 & 取地址,再 * 取值,雖然沒啥用:

*((int *)*(&p)) = 999;

假如 a 的地址是 6 的話,其實你這些花里胡哨的操作,最后到人家 CPU 眼里,就是一條簡單的指令:

movl $999, (6)

就是想把 999 放在 6 號格子嘛!

所以,不要把指針想得多么復雜和神圣,它就是方便了程序員編程,同時告訴編譯器應該怎么編譯成最終的指令。

你寫了個 *p,就是把 p 的值當做內存地址去訪問,在匯編語言層面就是加了個括號:

(p)

你寫了個 &a,就是取出變量 a 的內存地址,在匯編語言層面就是 lea 指令:

lea a, xxx

你如果寫了個 ***p 那就是,相當于加了三次括號:

(((p)))

當然啦,以上都是方便理解的偽指令,具體落實到真正的匯編語言,我會在后續的章節中講述,直接從匯編語言理解指針,你就會發現指針就是個工具人而已。

六、寫在最后

至此,我們的《你管這破玩意叫指針 -- 基礎篇》就講完了。

我們從最開始的內存格子出發,逐漸推導出類型系統和變量的作用,進而再引出本質上和普通變量沒有任何區別的指針變量,最后再推導出指針變量相關的操作,帶你看清了指針的本質。


 

你不要去記本文的知識點,重在整個推導的過程,要去理解指針想解決的問題是什么,它的合理性在哪,哪一部分信息是給程序員和編譯器看的,哪一部分操作最終又是真正落實到 CPU 指令的,這些才是關鍵。

當然,我還是給你簡單總結下知識點相關的部分,其實簡單說,就這么幾件事。

定義一個指針:

int * p;

賦值或初始化一個指針:

p = &a;

修改指針的內容:

*p = 999;

指針的加減(其實到后面講的數組才有價值):

p = p + 1;

完事,就這些!

最后,給大家推薦兩個網站。

一個是可以將 C 語言代碼實時編譯成匯編代碼,你可以用它來自己玩指針做實驗,看它最終到 CPU 指令層面是什么樣。

https://godbolt.org


 

一個是 GNU C 手冊,里面對各種語法和作用講述的非常清楚,不要再用百度搜博客了。

https://www.gnu.org/software/gnu-c-manual/gnu-c-manual.html

比如講類型系統里的整型類型:


 

再比如講指針的定義和初始化:


 

我相信本文看下來,一定有人想問,short * p 是不是應該寫成:

short *p

或者

short* p

自己去上面的文檔里找答案即可。

OK,本文到這里就終于要結束了,在接下來的進階篇里,我會講述二級指針、數組、函數指針、字符串、結構體、結構體數組與指針等內容。

雖然說是進階篇,但我認為,指針的本質反而是進階,而指針的進階反而是基礎。

因為假如理解了上述的一切,下面的所謂指針進階玩法,都可以通過指針的本質以及語言設計的合理性,推導出來,再往后無非是需要花時間熟練使用和掌握罷了。

所以,理解好今天的內容,非常重要!

 

來源:https://mp.weixin.qq.com/s/GVssqBoHWsOsRKTHXZR1lA 作者:低并發編程

分享到:
標簽:指針
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定