為什么要內(nèi)存對齊
雖然所有的變量最后都會保存到特定的地址內(nèi)存中去,但是相應的內(nèi)存空間必須滿足內(nèi)存對齊的要求,主要基于存在以下兩個原因:
硬件平臺原因:并不是所有的平臺都能夠訪問任意地址上的任意數(shù)據(jù),某些硬件平臺只能夠訪問對齊的地址,否則就會出現(xiàn)硬件異常錯誤。
性能原因:如果數(shù)據(jù)存放在未對齊的內(nèi)存空間中,則處理器在訪問變量時要做兩次次內(nèi)存訪問,而對齊的內(nèi)存訪問只需要一次。
上述兩個原因,第一個原因從字面意思上就能夠理解,那第二個原因是什么意思呢?假定現(xiàn)在有一個 32 位微處理器,那這個處理器訪問內(nèi)存都是按照 32 位進行的,也就是說一次性讀取或寫入都是四字節(jié)。假設現(xiàn)在有一個處理器要讀取一個大小為 4 字節(jié)的變量,在內(nèi)存對齊的情況下,處理器是這樣進行讀取的:
那如果數(shù)據(jù)存儲沒有按照內(nèi)存對齊的方式進行的話,處理器就會這樣進行讀?。?/p>
對比內(nèi)存對齊和內(nèi)存沒有對齊兩種情況我們可以明顯地看到:在內(nèi)存對齊的情況下,只需要兩個個步驟就可以將數(shù)據(jù)讀出來,首先處理器找到要讀出變量所在的地址,然后將數(shù)據(jù)讀出來。在內(nèi)存沒有對齊的情況下,卻需要以下四個步驟才能夠將數(shù)據(jù)取出來:
處理器找到要讀取變量所在的地址,也就是圖中紅色方塊所在位置。
由于此時內(nèi)存未對齊,處理器是 32 位的,一次性讀取或者寫入都是 4 字節(jié),所以需要將 0-3 地址內(nèi)的數(shù)據(jù)和 4-7 地址里的數(shù)據(jù)都取出來。
由于 0 - 3 地址范圍的 0 地址里的數(shù)據(jù)不屬于我們要讀取的數(shù)據(jù),因此將這一小塊的數(shù)據(jù)進行移位,把 0 地址里的數(shù)據(jù)移出去;同理, 4 - 7 地址范圍里的數(shù)據(jù)也要進行移位,保留 4 地址里的數(shù)據(jù)
合并移位之后的數(shù)據(jù),得出結果
通過上述的分析,我們可以知道內(nèi)存對齊能夠提升性能,這也是我們要進行內(nèi)存對齊的原因之一。
結構體內(nèi)存對齊
對齊原則
在明白了為何要進行內(nèi)存對齊之后,我們來分析結構體內(nèi)的內(nèi)存對齊,在進行具體的實例分析前,需要給出結構體內(nèi)存對齊的兩條基本原則。
結構體各成員變量的內(nèi)存空間的首地址必須是“對齊系數(shù)”和“變量實際長度”中較小者的整數(shù)倍。
對于結構體來說,在其各個數(shù)據(jù)都對齊之后,結構體本身也需要對齊,即結構體占用的總大小應該為“對齊系數(shù)”和“最大數(shù)據(jù)長度”中較小值的整數(shù)倍。
在給定了基本原則之后,我們通過一個例子來說明結構體的內(nèi)存對齊,假定當前的處理器是 32 位的,對齊系數(shù)為4。在這里筆者選擇在上一篇文章中涉及到的一個結構體進行解析,結構體如下:
struct data_test
{
char a; /*本身大小 1 字節(jié)*/
short b; /*本身大小 2 字節(jié)*/
char c[2]; /*數(shù)組單個成員 1 字節(jié)*/
double d; /*本身大小 8 字節(jié)*/
char e; /*本身大小 1 字節(jié)*/
int f; /*本身大小 4 字節(jié)*/
char g; /*本身大小 1 字節(jié)*/
}data;
根據(jù)我們剛剛給出的第一條對齊原則,先確定出每個變量的存儲位置,變量存儲方式是小端對齊,為了看起來更加形象,以 16 個字節(jié)作為一行來表示變量的存儲位置(這里所說的存儲位置是指相對于結構體起始地址的偏移)。
根據(jù)第一條規(guī)則:各成員的內(nèi)存空間的首地址必須是對齊系數(shù)和變量本身大小較小者的整數(shù)倍,這里對齊系數(shù)是 4,因此變量 a 、數(shù)組 c 、變量 e 、變量 g 的首地址需要滿足 1 的倍數(shù),變量 b 的首地址需要滿足 2 的倍數(shù),變量 d 的首地址需要滿足 4 的倍數(shù),變量 f 的首地址需要 4 的倍數(shù)。所以也就有了上述表格中的變量存儲位置。那既然結構體內(nèi)的成員都已經(jīng)對齊了,為什么還存在第二條原則呢?也就是說為什么結構體內(nèi)的成員已經(jīng)內(nèi)存對齊了,結構體本身還需要對齊?下面通過一個結構體數(shù)組來說明,比如我們定義了這樣一個結構體數(shù)組:
struct data_test
{
char a; /*本身大小 1 字節(jié)*/
short b; /*本身大小 2 字節(jié)*/
char c[2]; /*數(shù)組單個成員 1 字節(jié)*/
double d; /*本身大小 8 字節(jié)*/
char e; /*本身大小 1 字節(jié)*/
int f; /*本身大小 4 字節(jié)*/
char g; /*本身大小 1 字節(jié)*/
}data[2];
我們在放置成員存儲位置的時候,data[0] 按照成員對齊的原則依次存放,放到最后一個結構體成員時,如果不考慮結構體本身的對齊,按照數(shù)組元素是緊挨著存放的原則,那這個結構體數(shù)組應該是按照下圖進行存儲的:
從上圖中我們可以看到雖然 data[0] 中的成員都對齊了,但是由于結構體本身的不對齊,導致 data[1] 中的好多成員都不對齊了,因此,在完成了結構體成員的內(nèi)存對齊后,我們還需要依據(jù)第二條原則:結構體占用的總大小應該為“對齊系數(shù)”和“最大數(shù)據(jù)長度”中較小值的整數(shù)倍,來對結構體本身進行對齊,因此正確的結構體數(shù)組的存儲位置應該如下圖所示:
這里需要注意的是,上述原則針對的是結構體占用的總大小,而不是結構體的首地址,所以,在結構體本身還沒有對齊的情況下,data[0] 的大小是 25 個字節(jié),但是根據(jù)上述原則,在對齊系數(shù)為 4 的前提下,結構體大小應該是 4 的整數(shù)倍,所以要對結構體進行所占內(nèi)存進行填充,因此:data[0] 最終的大小是 28 字節(jié),結構體數(shù)組 data 的大小為 56 字節(jié)
結構體內(nèi)成員順序
通過上述分析我們可以很容易就想到,根據(jù)第一條原則,那么結構體成員定義的先后順序會對最終結構體占用的內(nèi)存造成影響,比如現(xiàn)在調(diào)整結構體 data 內(nèi)成員的定義順序,如下:
struct data_test
{
char a; /*本身大小 1 字節(jié)*/
char c[2]; /*數(shù)組單個成員 1 字節(jié)*/
char e; /*本身大小 1 字節(jié)*/
char g; /*本身大小 1 字節(jié)*/
short b; /*本身大小 2 字節(jié)*/
int f; /*本身大小 4 字節(jié)*/
double d; /*本身大小 8 字節(jié)*/
}data;
改變結構體成員順序后的存儲位置如下:
通過圖片就可以看到只有一塊藍色的填充區(qū)域,在成員對齊之后,結構體大小是 20 ,已經(jīng)是 4 的整數(shù)倍,已經(jīng)無須再做填充,所以調(diào)整順序后的結構體大小為 20 個字節(jié),相比于之前沒有改變順序之前整整減少了 8 個字節(jié),也可以看出結構體成員的定義順序也是需要關注的一個問題,關于結構體內(nèi)成員定義的順序應該遵循這樣一個原則:按照長度遞增的順序依次定義各個成員
如何設定對齊系數(shù)
查看默認對齊系數(shù)
在上述我們對結構體內(nèi)存對齊的分析中,我們都是假定對齊系數(shù)為 4 ,實際上對于編譯器來說都有默認的對齊系數(shù),我們可以輸入偽指令,然后以報警信息的方式顯示當前的對齊系數(shù):
#pragma pack(show)
設置對齊系數(shù)
#pragma pack(1) /*設置一字節(jié)對齊*/
struct data_test
{
char a;
short b;
char c[2];
double d;
char e;
int f;
char g;
} data;
#pragma pack()/*取消一字節(jié)對齊,恢復默認對齊系數(shù)*/
在這里,設置1字節(jié)對齊其實也就相當于不進行內(nèi)存對齊,因為任何地址都可以是 1 的整數(shù)倍,最后,需要注意的是使用這種方法設置字節(jié)對齊,要在想要取消一字節(jié)對齊的地方使用偽指令 #pragma pack() 取消一字節(jié)對齊,否則后面所定義的結構體會繼續(xù)采用剛剛所設置的對齊方式。除了采用上述這樣設置一字節(jié)對齊的方式取消內(nèi)存對齊,也可以采用下面的方式取消字節(jié)對齊:
struct __attribute__((packed)) data_test2
{
char a;
short b;
char c[2];
double d;
char e;
int f;
char g;
}data;
這種方式相對于上述方法來講,不用執(zhí)行取消操作,作用域只是本結構體,不會影響其他結構體的對齊方式。最后,取消字節(jié)對齊的結構體(或者說是按照 1 字節(jié)對齊的結構體)data 的大小就是 19 個字節(jié),即將結構體內(nèi)的所有成員的字節(jié)大小相加即可。
總結
了解結構體的內(nèi)存對齊,從而在定義結構體成員時按照最優(yōu)的順序進行定義,對于 RAM 資源比較緊缺的 MCU 來講,也是非常重要的。同時,在筆者的上篇文章《union 的概念及在嵌入式編程中的應用中》,所講到的運用 union 和 struct 嵌套來便捷地解析數(shù)據(jù),也應該取消字節(jié)對齊(因為上篇文章最后一個例子結構體成員大小都是一個字節(jié),內(nèi)存對齊取消與否都不影響成員的存儲位置,所以沒取消)。
參考資料 [1] https://aticleworld.com/data-alignment-and-structure-padding-bytes/
[2] https://blog.51cto.com/zhangyu/673792
本文授權轉載自公眾號“wenzi嵌入式軟件”,作者wenzid
-END-
推薦閱讀
免責聲明:本文內(nèi)容由21ic獲得授權后發(fā)布,版權歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!