C++ 虛擬函式簡介!程式設計師必學知識,掌握程式設計從物件開始!
本文將簡單探究一下c++中的虛擬函式實現機制。主要基於vs2013生成的32位程式碼進行研究,相信其它編譯器(比如,gcc)的實現大同小異。
先從物件大小開始
假設我們有如下程式碼,假設int佔4位元組,指標佔4位元組。
#include "stdafx.h"
#include "stdlib.h"
#include "stddef.h"
class CBase
{
public:
virtual void VFun1() { printf(__FUNCTION__ "\n"); }
virtual void VFun2() { printf(__FUNCTION__ "\n"); }
virtual ~CBase() { printf(__FUNCTION__ "\n"); }
int data;
};
class CDerived : public CBase
{
public:
virtual void VFunNew() { printf(__FUNCTION__ "\n"); }
virtual void VFun1() override { printf(__FUNCTION__ "\n"); }
virtual ~CDerived() override { printf(__FUNCTION__ "\n"); }
};
int _tmain(int argc, _TCHAR* argv[])
{
printf("sizeof CBase is: %d, offset of data is %d\n",
sizeof(CBase), offsetof(CBase, data));
system("pause");
CBase* pBase = new CDerived();
pBase->VFun1();
pBase->VFun2();
system("pause");
return 0;
}
輸出結果如下圖:
有沒有覺得意外?從類定義可知,data佔4位元組,那另外的4位元組是哪裡來的呢?data的偏移值不應該是0嗎?為什麼是4呢?
記憶體佈局
如果一個類有虛擬函式,編譯器會自動為這個型別的物件在頭部增加一個虛表指標(vftable),指向虛擬函式表。虛擬函式表中存放著一個個的虛擬函式。
CBase和CDerived類物件的記憶體佈局如下:
注意:虛擬函式表中索引為-1的地方指向了跟動態型別轉換相關的資訊。
虛表指標的初始化
vftable是在類的建構函式中初始化的。可以在IDA中分別檢視CBase類 和CDerived類的建構函式的反彙編程式碼。
CBase建構函式的反彙編程式碼如下(關鍵部分已註釋):
由反彙編程式碼可知,CBase的建構函式會把CBase物件開始的位置(存放虛表指標)設定為CBase::vftable。
CDerived建構函式的反彙編程式碼如下(關鍵部分已註釋):
由反彙編程式碼可知,CDerived的建構函式會先呼叫CBase的建構函式進行基類部分的初始化,在CBase建構函式的內部把CDerived物件開始的位置設定為CBase::vftable,然後呼叫自身的初始化部分,會把CDerived::vftable的地址放到物件開始的位置,從而替換掉了CBase類的虛表指標。
虛擬函式表的內容
瞭解完了虛表指標的初始化過程,再來看看vftable裡面都有哪些內容。
可以雙擊??_7CBase@@6B@(或者直接按回車)跳轉到虛表所在的地方。如下圖:
說明:上側是CBase類的虛表內容,下側是CDerived類的虛表內容。
請注意圖片上側黃色高亮部分,也就是vftable[-1]的地方,是跟動態型別轉換相關的資訊,後面有機會介紹。
虛擬函式呼叫
理解了類物件的記憶體佈局及虛擬函式表之後,再理解虛擬函式的呼叫過程就比較簡單了。
有些C++基礎的小夥伴兒都知道本例中的輸出結果應該如下圖所示:
直接看一下pBase->VFun1()和pBase->VFun2()對應的反彙編程式碼就應該明白一切了。如下圖:
因為pBase指向的實際是CDerived型別的物件,所以虛表是CDerived類的。如下圖所示:
經過以上的分析,輸出結果合情合理。
說明
本文只是拿了一個最最簡單的例子做演示。像多重繼承,虛繼承等比較複雜的情況,感興趣的小夥伴可以自行研究。
雖然這個例子很簡單,但是背後的機理值得了解清楚,非常有用。比如,當庫中的介面與庫標頭檔案不匹配的時候,很可能莫名其妙的就崩潰了。
這時可以通過檢視指標對應的虛表的內容來檢視庫中的虛擬函式都有哪些,跟標頭檔案對比後就可以比較準確的判斷是否是庫不匹配的問題。還可以根據虛表的內容,猜測出基類指標指向的具體的子類物件的型別。
可以在windbg中使用dps命令快速列印,如下圖:
總結
虛表指標是在類的建構函式中初始化的,相應的程式碼由編譯器自動生成。
在生成呼叫虛擬函式的程式碼的時候,並沒有直接把虛擬函式地址寫死,而是通過虛表進行呼叫,多了一層間接層。
Any problem in computer science can be solved by anther layer of indirection.(電腦科學領域的任何問題都可以通過增加一個間接的中間層來解決)
注意:如果通過物件呼叫虛擬函式,會是另外一種情況,因為不存在多型,直接使用函式低階進行呼叫就可以了。感興趣的小夥伴兒可以自行實驗。
如果你想快速掌握C/C++程式設計,小編推薦我的C語言/C++程式設計學習基地【點選進入】!
都是學程式設計小夥伴們,帶你入個門還是簡簡單單啦,一起學習,一起加油~
還有許多學習資料和視訊,相信你會喜歡的!
涉及:程式設計入門、遊戲程式設計、課程設計、黑客等等......