數(shù)組與指針
在我們教學(xué)的時(shí)候,常常會碰到學(xué)生問:老師,數(shù)組和指針有沒有區(qū)別,是不是數(shù)組就是指針,如果有區(qū)別,區(qū)別在哪里?為此我寫了這篇文章,希望能有點(diǎn)啟發(fā)給學(xué)生。
先從簡單的說起,一維數(shù)組和指針。
平常我們操作數(shù)組都是通過數(shù)組名加下標(biāo)的方式,那么這個(gè)數(shù)組名到底代表什么含義?其實(shí)數(shù)組名它是一個(gè)指針常量,它是一個(gè)地址,這個(gè)地址是數(shù)組的首地址,也就是數(shù)組第一個(gè)元素的地址。例如:
int a[10];
你可以去看一下,a, &a, &a[0]它都是同一個(gè)值,都是數(shù)組的首地址。
那么這個(gè)指針常量它的類型的是什么呢,如果數(shù)組元素的類型是int類型的,那么這個(gè)指針常量的類型就是int*,像這里就是int*類型。還有要注意的是這個(gè)指針是一個(gè)常量,不能修改這個(gè)值,但是有兩種情況下數(shù)組名不被當(dāng)作一個(gè)指針常量看待,一個(gè)是&運(yùn)算,另一個(gè)是sizeof,一個(gè)常量肯定是沒有地址的,所以&運(yùn)算是取得數(shù)組的首地址,而sizeof是返回整個(gè)數(shù)組的長度,而不是返回的指針長度。
所以數(shù)組和指針是如此的相似,以至于它們可以互換使用。例如,數(shù)組元素除了使用下標(biāo)方式操作外,還可以使用指針的方式:
*(a + 1)代表第二個(gè)元素, *(a + 2)代表第三個(gè)元素。
數(shù)組可以當(dāng)作指針來使用,指針同樣也可以當(dāng)作數(shù)組來使用。
雖然數(shù)組和指針有如此相似地方,但是它們還是有區(qū)別的。
(1) 數(shù)組名這個(gè)指針?biāo)且粋€(gè)指針常量,也就是你不能對它進(jìn)行算數(shù)運(yùn)算,例如a++這是錯誤的操作。但是我們定義的指針?biāo)鼌s是一個(gè)變量。
(2) 我們定義一個(gè)數(shù)組,它就分配了相應(yīng)大小的空間,但是定義指針,它只是分配4字節(jié)大小空間,它只能指向其它存儲空間,否則,它沒有任何意義。
既然數(shù)組和指針有如此多的相似之處,那我們到底是使用數(shù)組還是指針呢,這要看具體的上下環(huán)境,如果是數(shù)組,那么使用數(shù)組的下標(biāo)形式更讓人理解,讓人一看就知道這是一個(gè)數(shù)組,如果是指針,那就直接使用指針的方式操作,這樣也不會混淆程序的其它閱讀者。
一維數(shù)組作為函數(shù)參數(shù)
當(dāng)我們將一個(gè)數(shù)組作為參數(shù)傳遞給函數(shù)時(shí),實(shí)際上是將數(shù)組的首地址傳給了子函數(shù)。那么這個(gè)函數(shù)參數(shù)該怎么去定義呢,有兩種寫法,例如:
int strlen(char string[]);
int strlen(char* string);
這兩種寫法都是正確的,但是哪種寫法更好呢,當(dāng)然是使用指針的寫法更好,因?yàn)槲覀兊牡拇_確是傳遞的一個(gè)指針給函數(shù)。
上面是簡單的介紹,接下來是具體的解釋:
數(shù)組是什么?什么是左值和右值?
筆者引用《C專家編程》中的一段話:
出現(xiàn)在賦值符左邊的符號有時(shí)被稱為左值,出現(xiàn)在賦值符右邊的符號有時(shí)被稱為右值。編譯器為每個(gè)變量分配一個(gè)地址(左值)。這個(gè)地址在編譯時(shí)可知,而且該變 量在運(yùn)行時(shí)一直保存于這個(gè)地址。相反,存儲于變量中的值(它的右值)只有在運(yùn)行時(shí)才可知。如果需要用到變量中存儲的值,編譯器就發(fā)出指令從指定地址讀入變 量值并將它存于寄存器中
我對左值的理解和書上有些區(qū)別,我把這里的“符號”稱為“對象”,每一個(gè)符號都代表一個(gè)對象,對象與地址是一一對應(yīng)的。即如果聲明了 int a,那么 a 作為一個(gè)左值時(shí),a 即代表這個(gè)保存在某個(gè)特定的地址的對象,對這個(gè)對象賦值即為把值放在這個(gè)特定的地址;a 作為右值時(shí)即代表 a 的內(nèi)容,就是一個(gè)單純的值,而不是對象。一個(gè)值是不能作為左值的,比如一個(gè)常數(shù) 1, 1 = a 這樣的賦值語句是無法編譯通過的。在我看來,“左值”義同“對象”,“右值”義同“值”,所以下面“左值”和“對象”指的是相同的東西。但是“左值”又有 一個(gè)子集:“可修改的左值”,只有這個(gè)子集中的東西才能放在賦值號左邊,因此我認(rèn)為將引用中的第一句話修改為“出現(xiàn)在賦值符左邊的符號有時(shí)被稱為可修改的 左值”更能表達(dá)其實(shí)際的意思。為什么要引出這個(gè)子集,為的就是要把數(shù)組分出來,數(shù)組是左值,但并不是可修改的左值,因此你也不能直接把數(shù)組名放在等號左邊進(jìn)行賦值。
數(shù)組就是數(shù)組!
我先把結(jié)論放在這里,然后在進(jìn)行分析:數(shù)組就是數(shù)組,一個(gè)數(shù)組名就代表一個(gè)數(shù)組對象,這個(gè)對象內(nèi)可以有一個(gè)或多個(gè)元素,每個(gè)元素類型都相同;正如 int 就是 int,一個(gè) int 變量名就代表一個(gè) int 類型對象。看到這里,你可能要笑了,這不是什么都沒說嗎,誰不知道數(shù)組是這個(gè)意思啊,我想知道數(shù)組和指針什么關(guān)系。其實(shí)對數(shù)組的認(rèn)識就是這樣一個(gè)返璞歸真過程,看我來慢慢解釋。
以下是代碼:
1 /* 1.c */
2 int main()
3 {
4 int foo[] = {1};
5 int bar = 1;
6 return 0;
7 }
使用 gcc 將其匯編并以 intel 格式輸出匯編語言文件:
1 gcc –S –masm=intel 1.c
關(guān)鍵部分:
1 mov DWORD PTR [esp+8], 1
2 mov DWORD PTR [esp+12], 1
esp+8 位置就是那個(gè) int foo[],esp+12 位置就是那個(gè) int bar。可見,給 int 數(shù)組的賦值時(shí)就像給一個(gè) int 變量賦值一樣,并沒用指針來進(jìn)行間接訪問,這個(gè) int 數(shù)組對象 foo 的內(nèi)存地址在編譯時(shí)就確定了,是 esp+8;正如那個(gè) int 對象 bar 一樣,它的內(nèi)存地址在編譯時(shí)也確定了,是esp+12。
以示區(qū)別,我將下面代碼同樣以匯編語言輸出:
1 /* 2.c */
2 #include
3 int main()
4 {
5 int *foo = (int *)malloc(sizeof (int));
6 *foo = 1;
7 return 0;
8 }
匯編的關(guān)鍵部分:
1 mov DWORD PTR [esp], 4
2 call _malloc
3 mov DWORD PTR [esp+28], eax
4 mov eax, DWORD PTR [esp+28]
5 mov DWORD PTR [eax], 1
前兩句為 foo分配內(nèi)存空間,第三句將分配的內(nèi)存空間地址值賦給 foo,foo 的地址為 esp+28,編譯時(shí)已知。下面是賦值部分,首先從 foo 那里得到地址值,然后向這個(gè)地址賦值,這里可以看出和給數(shù)組賦值的差別,給數(shù)組賦值時(shí)是將值直接賦到了數(shù)組中,而不用從哪里得到數(shù)組的地址。
由上面可以看出,數(shù)組更像一個(gè)普通的變量,編譯時(shí)就知道了其地址,可以直接賦值。
數(shù)組作為左值
數(shù)組不能放在賦值號左邊,但數(shù)組仍可以作為一個(gè)左值或者說對象出現(xiàn)在語句中,一個(gè)重要的例子就是取地址操作:&。取地址操作 &的操作數(shù)必須是一個(gè)左值,而不能是一個(gè)右值。比如一個(gè)變量int a = 1,&a 就可以得到 a 的地址,但 &1是非法的,一個(gè)單純的數(shù)值是沒有地址的。那么對于一個(gè)int foo[],&foo 會返回一個(gè)什么樣的值呢?自然是一個(gè)指向數(shù)組的指針咯,下面的程序可以看出來:
1 int main()
2 {
3 int foo[1];
4 int bar[1];
5 bar = &foo; //故意觸發(fā)一個(gè) error
6 return 0;
7 }
那個(gè)賦值語句一定會觸發(fā)錯誤,我們可以根據(jù)編譯輸出來確定它們的類型,錯誤為:
1 error: incompatible types when assigning to type 'int[1]' from type 'int (*)[1]'
沒錯,&foo 返回?cái)?shù)據(jù)類型為 int (*)[1],就是一個(gè)指向數(shù)組的指針。指向數(shù)組?指向數(shù)組的哪里呢?指向數(shù)組對象首地址,正如一個(gè)指向 int 對象的指針指向那個(gè) int 對象占有的兩個(gè)或四個(gè)內(nèi)存單元的首地址一樣。
把 &foo 賦給一個(gè)普通的指針是可以的,不過會觸發(fā)一個(gè) warning,因?yàn)閕nt * 與 int (*)[1] 并不相容。賦值后普通指針的值與 &foo 的值是相同的,都是數(shù)組對象的首地址,只是普通指針把這塊內(nèi)存當(dāng)做 int 對象處理而已。
由于 C 語言是弱類型語言,你把 &foo 賦給int **********bar 或者 int *baz都是可以的,都不會導(dǎo)致 error,只會導(dǎo)致 warning,此時(shí)你打印出 *bar 或者 *baz 的值都是 foo 中第一個(gè)整數(shù)的值(前提是指針和數(shù)組占用空間大小相等)。正如文章開頭的代碼那樣,以這個(gè)整數(shù)的值作為一個(gè)地址值進(jìn)行間接訪問(*(*bar))就會導(dǎo)致 非法訪問的錯誤。
數(shù)組作為右值
數(shù)組作為右值時(shí)會發(fā)生什么?返回?cái)?shù)組對象內(nèi)的所有值自然不可能,因此 C 語言中采取的方法是數(shù)組作為右值時(shí)返回對象中元素類型的指針,指針指向第一個(gè)元素,類似上一個(gè)例子:
1 int main()
2 {
3 int foo[1];
4 int bar[1];
5 bar = foo; //故意觸發(fā)一個(gè) error
6 return 0;
7 }
出錯信息為:
1 error: incompatible types when assigning to type 'int[1]' from type 'int *'
數(shù)組作為左值和數(shù)組作為右值時(shí)的區(qū)別造成了無數(shù)人的困惑與誤解:foo 作為右值時(shí)確實(shí)等價(jià)于一個(gè)指針,因?yàn)閿?shù)組無法像普通對象那樣返回它的值,它的元素可能有成百上千個(gè),但作為一個(gè)右值時(shí)——比如作為取地址操作符的操作數(shù) 時(shí),數(shù)組就是作為一個(gè)數(shù)組對象而出現(xiàn)的,而不是指針,取地址返回一個(gè)指向數(shù)組的指針,而不是指向指針的指針。
接下來再分析下數(shù)組指針和指針數(shù)組的區(qū)別:
數(shù)組指針(也稱行指針)
定義 int (*p)[n];
()優(yōu)先級高,首先說明p是一個(gè)指針,指向一個(gè)整型的一維數(shù)組,這個(gè)一維數(shù)組的長度是n,也可以說是p的步長。也就是說執(zhí)行p+1時(shí),p要跨過n個(gè)整型數(shù)據(jù)的長度。
如要將二維數(shù)組賦給一指針,應(yīng)這樣賦值:
int a[3][4];
int (*p)[4]; //該語句是定義一個(gè)數(shù)組指針,指向含4個(gè)元素的一維數(shù)組。
p=a; //將該二維數(shù)組的首地址賦給p,也就是a[0]或&a[0][0]
p++; //該語句執(zhí)行過后,也就是p=p+1;p跨過行a[0][]指向了行a[1][]
所以數(shù)組指針也稱指向一維數(shù)組的指針,亦稱行指針。
指針數(shù)組
定義 int *p[n];
[]優(yōu)先級高,先與p結(jié)合成為一個(gè)數(shù)組,再由int*說明這是一個(gè)整型指針數(shù)組,它有n個(gè)指針 類型的數(shù)組元素。這里執(zhí)行p+1是錯誤的,這樣賦值也是錯誤的:p=a;因?yàn)閜是個(gè)不可知的表示,只存在p[0]、p[1]、p[2]...p[n- 1],而且它們分別是指針變量可以用來存放變量地址。但可以這樣 *p=a; 這里*p表示指針數(shù)組第一個(gè)元素的值,a的首地址的值。
如要將二維數(shù)組賦給一指針數(shù)組:
int *p[3];
int a[3][4];
for(i=0;i<3;i++)
p[i]=a[i];
這里int *p[3] 表示一個(gè)一維數(shù)組內(nèi)存放著三個(gè)指針變量,分別是p[0]、p[1]、p[2],所以要分別賦值。
這樣兩者的區(qū)別就豁然開朗了,數(shù)組指針只是一個(gè)指針變量,似乎是C語言里專門用來指向二維數(shù)組的,它占有內(nèi)存中一個(gè)指針的存儲空間。指針數(shù)組是多個(gè)指針變量,以數(shù)組形式存在內(nèi)存當(dāng)中,占有多個(gè)指針的存儲空間。
還需要說明的一點(diǎn)就是,同時(shí)用來指向二維數(shù)組時(shí),其引用和用數(shù)組名引用都是一樣的。
比如要表示數(shù)組中i行j列一個(gè)元素:
*(p[i]+j)、*(*(p+i)+j)、(*(p+i))[j]、p[i][j]
綜上所述一句話就是:數(shù)組就是數(shù)組,有著自己的特性。