c結構體對齊深刻理解

阿新 • • 發佈：2019-01-12

1．
先看下面的例子：
struct A{
   char c1;
   int i;
   short s;
   int j;
}a;

struct B{
   int i;
   int j;
   short s;
   char c1;
}b;

結構A沒有遵守位元組對齊原則（為了區分，我將它叫做對齊宣告原則），結構B遵守了。我們來看看在x86上會出現什麼結果。先打印出a和b的各個成員的地址。會看到a中，各個成員間的間距是4個位元組。b中，i和j，j和s都間距4個位元組，但是s和c1間距2個位元組。所以：
sizeof(a) = 16
sizeof(b) = 12
為什麼會有這樣的結果呢？這就是x86上位元組對齊的作用。為了加快程式執行的速度，一些體系結構以對齊的方式設計，通常以字長作為對齊邊界。對於一些結構體變數，整個結構要對齊在內部成員變數最大的對齊邊界，如B，整個結構以4為對齊邊界，所以sizeof(b)為12，而不是11。
對於A來講，雖然宣告的時候沒有對齊，但是根據打印出的地址來看，編譯器已經自動為其對齊了，所以每個成員的間距是4。在x86下，宣告A與B唯一的差別，僅在於A多浪費了4個位元組記憶體。（是不是某些特定情況下，B比A執行更快，這個還需要討論。比如緊挨的兩條分別取s和c1的指令）
如果體系結構是不對齊的，A中的成員將會一個挨一個儲存，從而sizeof(a)為11。顯然對齊更浪費了空間。那麼為什麼要使用對齊呢？
體系結構的對齊和不對齊，是在時間和空間上的一個權衡。對齊節省了時間。假設一個體繫結構的字長為w，那麼它同時就假設了在這種體系結構上對寬度為w的資料的處理最頻繁也是最重要的。它的設計也是從優先提高對w位資料操作的效率來考慮的。比如說讀寫時，大多數情況下需要讀寫w位資料，那麼資料通道就會是w位。如果所有的資料訪問都以w位對齊，那麼訪問還可以進一步加快，因為需要傳輸的地址位減少，定址可以加快。大多數體系結構都是按照字長來對齊訪問資料的。不對齊的時候，有的會出錯，比如MIPS上會產生bus error，而x86則會進行多次訪問來拼接得到的結果，從而降低執行效率。

有些體系結構是必須要求對齊的，如sparc，MIPS。它們在硬體的設計上就強制性的要求對齊。不是因為它們作不到對齊的訪問，而是它們認為這樣沒有意義。它們追求的是速度。

上面講了體系結構的對齊。在IA-32上面，sizeof(a)為16，就是對齊的結果。下面我們來看，為什麼變數宣告的時候也要儘量對齊。
我們看到，結構A的宣告並不對齊，但是它的成員地址仍是以4為邊界對齊的（成員間距為4）。這是編譯器的功勞。因為我所用的編譯器gcc，預設是對齊的。而x86可以處理不對齊的資料訪問，所以這樣宣告程式並不會出錯。但是對於其他結構，只能訪問對齊的資料，而編譯器又不小心設定了不對齊的選項，則程式碼就不能執行了。如果按照B的方式宣告，則不管編譯器是否設定了對齊選項，都能夠正確的訪問資料。

目前的開發普遍比較重視效能，所以對齊的問題，有三種不同的處理方法：
1）     採用B的方式宣告
2）     對於邏輯上相關的成員變數希望放在靠近的位置，就寫成A的方式。有一種做法是顯式的插入reserved成員：
          struct A{
            char c1;
            char reserved1[3];
            int i;
            short s;
            char reserved2[2];
            int j;
}a;
3）     隨便怎麼寫，一切交給編譯器自動對齊。

程式碼中關於對齊的隱患，很多是隱式的。比如在強制型別轉換的時候。下面舉個例子：
unsigned int ui_1=0x12345678;
unsigned char *p=NULL;
unsigned short *us_1=NULL;

p=&ui_1;
*p=0x00;
us_1=(unsigned short *)(p+1);
*us_1=0x0000;
最後兩句程式碼，從奇數邊界去訪問unsigned short型變數，顯然不符合對齊的規定。在x86上，類似的操作只會影響效率，但是在MIPS或者sparc上，可能就是一個bus error（我沒有試）。
有些人喜歡通過移動指標來操作結構中的成員（比如在linux操作struct sk_buff的成員），但是我們看到，A中(&c1+1) 決不等於&i。不過B中(&s+2)就是 &c1了。所以，我們清楚了結構中成員的存放位置，才能編寫無錯的程式碼。同時切記，不管對於結構，陣列，或者普通的變數，在作強制型別轉換時一定要多看看：）不過為了不那麼累，還是遵守宣告對齊原則吧！（這個原則是說變數儘量宣告在它的對齊邊界上，而且在節省空間的基礎上）

2．C/C++函式呼叫方式
我們當然早就知道，C/C++中的函式呼叫，都是以值傳遞的方式，而不是引數傳遞。那麼，值傳遞是如何實現的呢？
函式呼叫前的典型彙編碼如下：
push    %eax
call    0x401394 <test__Fc>
add     $0x10,%esp
首先，入棧的是實參的地址。由於被調函式都是對地址進行操作，所以就能夠理解值傳遞的原理和引數是引用時的情況了。
Call ***，是要呼叫函數了，後面的地址，就是函式的入口地址。Call指令等價於：
    PUSH IP
    JMP ***
首先把當前的執行地址IP壓棧，然後跳轉到函式執行。
執行完後，被調函式要返回，就要執行RET指令。RET等價於POP IP，恢復CALL之前的執行地址。所以一旦使用CALL指令，堆疊指標SP就會自動減2，因為IP的值進棧了。

函式的引數進棧的順序是從右到左，這是C與其它語言如pascal的不同之處。函式呼叫都以以下語句開始：
push    %ebp
mov     %esp,%ebp
首先儲存BP的值，然後將當前的堆疊指標傳遞給BP。那麼現在BP+2就是IP的值（16位register的情況），BP+4放第一個引數的值，BP+6放第二個引數……。函式在結束前，要執行POP BP。

C/C++語言預設的函式呼叫方式，都是由主呼叫函式進行引數壓棧並且恢復堆疊，實參的壓棧順序是從右到左，最後由主調函式進行堆疊恢復。由於主呼叫函式管理堆疊，所以可以實現變參函式。
對於WINAPI和CALLBACK函式，在主呼叫函式中負責壓棧，在被呼叫函式中負責彈出堆疊中的引數，並且負責恢復堆疊。因此不能實現變參函式。

c結構體對齊深刻理解

c結構體對齊深刻理解

C/C++結構體對齊方式詳解，從記憶體地址進行解析

C-結構體對齊

c++結構體對齊

C/C++結構體對齊_思索

C語言結構體對齊(記憶體對齊問題)

C++關於結構體對齊

C語言結構體對齊與不對齊設定總結

13）結構體對齊問題

結構體對齊

linux中結構體對齊【轉】

逆向基礎之結構體對齊

結構體對齊總結

結構體對齊——結構體記憶體佈局

結構體對齊——結構體內存布局

sizeof與strlen用法詳解(結構體對齊)

結構體對齊問題.

結構體對齊的原則及原因分析

64位系統結構體對齊訪問段錯誤

結構體對齊問題以及強制型別轉換問題總結

c結構體對齊深刻理解

相關推薦