【究根源】詳解C語(yǔ)言變長(zhǎng)數(shù)組
最近在做通信協(xié)議相關(guān)項(xiàng)目,在通信過程中一般都會(huì)有包長(zhǎng),數(shù)據(jù)緩沖等等信息,而實(shí)際場(chǎng)景中,數(shù)據(jù)包長(zhǎng)度是不確定的,使用數(shù)組的定長(zhǎng)包或者指針數(shù)據(jù)包都有一定的缺陷,那么可變長(zhǎng)的數(shù)據(jù)緩存方法有嗎?有的,這就是0長(zhǎng)度數(shù)組,又稱為柔性數(shù)組(flexible array),通常用來實(shí)現(xiàn)變長(zhǎng)數(shù)組。
變長(zhǎng)數(shù)組簡(jiǎn)介
變長(zhǎng)數(shù)組是數(shù)組大小待定的數(shù)組,C語(yǔ)言中結(jié)構(gòu)體的最后一個(gè)元素可以是大小未知的數(shù)組,也就是所謂的0長(zhǎng)度。在標(biāo)準(zhǔn)C/C 中,不允許用0長(zhǎng)度數(shù)組,但在GNU C中,卻可以定義0長(zhǎng)度數(shù)組(在C99之前寫成長(zhǎng)度為0,C99中可以直接不寫索引),我們可以用結(jié)構(gòu)體來創(chuàng)建變長(zhǎng)數(shù)組。typedef?struct?{
????int?len;
????int?array[0];//int?array[];
}SoftArray;
它的主要用途是為了滿足需要變長(zhǎng)度的結(jié)構(gòu)體,為了解決使用數(shù)組時(shí)內(nèi)存的冗余和數(shù)組的越界問題。sizeof(SoftArray);
的值在32位操作系統(tǒng)下剛好為4,也就是一個(gè)int型變量大小,這說明結(jié)構(gòu)體中的數(shù)組沒有占用內(nèi)存。對(duì)于編譯器來說,此時(shí)長(zhǎng)度為0的數(shù)組并不占用空間,因?yàn)閿?shù)組名本身不占空間,它只是一個(gè)偏移量,數(shù)組名這個(gè)符號(hào)本身代表了一個(gè)不可修改的地址常量 (注意:數(shù)組名永遠(yuǎn)都不會(huì)是指針?。?/p>對(duì)于這個(gè)數(shù)組的大小,我們可以進(jìn)行動(dòng)態(tài)分配!對(duì)于變長(zhǎng)數(shù)組的這個(gè)特點(diǎn),很容易構(gòu)造出變成結(jié)構(gòu)體,如緩沖區(qū),數(shù)據(jù)包等等變長(zhǎng)度數(shù)組的優(yōu)缺點(diǎn)
這次的通信協(xié)議項(xiàng)目,假如使用數(shù)組來傳遞數(shù)據(jù),那么一般定義如下,其中包的長(zhǎng)度maxLen是一個(gè)定值,假設(shè)為1024。typedef?struct?{
????int?len;
????int?array[maxLen];
}SoftArray;
這包數(shù)據(jù)的大小為sizeof(int) sizeof(int) * maxLen
,由于考慮到數(shù)據(jù)的溢出, maxLen一般會(huì)設(shè)置得足夠長(zhǎng)足以容納最大的數(shù)據(jù), 因此數(shù)組很多情況下可能都沒有填滿數(shù)據(jù), 造成了浪費(fèi)。而使用指針的話,則定義如下typedef?struct?
{
????int?len;
????char?*array;
};
數(shù)據(jù)結(jié)構(gòu)的大小為sizeof(int) sizeof(int *)
,使用指針結(jié)果作為緩沖區(qū), 只多使用了一個(gè)指針大小的空間,不會(huì)造成空間的大量浪費(fèi),但需要額外開辟和釋放數(shù)據(jù)域的空間,我們并不能假定使用者了解我們開辟的細(xì)節(jié), 并按照約定的操作釋放空間, 因此使用起來多有不便, 甚至造成內(nèi)存泄漏。變成數(shù)組可以節(jié)約空間,解決使用數(shù)組時(shí)內(nèi)存的冗余和數(shù)組的越界問題。但也有一個(gè)缺點(diǎn)就是結(jié)構(gòu)體中的變長(zhǎng)數(shù)組只能放在最后面。typedef?struct?{
????int?len;
????int?array[];
????int?CRC;
}SoftArray;
這種用法是不行的,不支持,會(huì)報(bào)以下錯(cuò)誤,如果后續(xù)要加上一些其他的數(shù)據(jù)就不能用了。其實(shí)柔性數(shù)組成員在實(shí)現(xiàn)跳躍表時(shí)有它特別的用法,在Redis的SDS數(shù)據(jù)結(jié)構(gòu)中和跳躍表的實(shí)現(xiàn)上,也使用柔性數(shù)組成員。為什么0長(zhǎng)度數(shù)組不占用存儲(chǔ)空間
由于0長(zhǎng)度數(shù)組是GNU C的擴(kuò)展,有一些巧妙編寫的詭異代碼, 其執(zhí)行結(jié)果就是依賴于編譯器和優(yōu)化策略的實(shí)現(xiàn)的,我們來看看以下代碼#include?
#include?
int?main(void)
{
????char?a[0];
????printf("%p\n",?a);
????char?b[0];
????printf("%p\n",?b);
????const?char?*c=?"Hello";
????printf("%p\n",?c);
????const?char?*d?=?"Hello";
????printf("%p\n",?d);
????return?EXIT_SUCCESS;
}
編譯結(jié)果是:可以看到a和b的地址就會(huì)被編譯器優(yōu)化到一處, 因?yàn)閍[0] 和 b[0] 對(duì)于程序來說是無法使用的, 同樣編譯器對(duì)于相同字符串常量, 往往地址也是優(yōu)化到一處, 減少空間占用。所以其本質(zhì)上涉及到的是一個(gè)C語(yǔ)言里面的數(shù)組和指針的區(qū)別問題,Programming Abstractions in C
一書中提到:“arr is defined to be identical to