1、C+虚函数表的工作原理虚函数表工作原理C+中的虚函数的作用主要是实现了多态的机制。关于多态,简而言之就是用父类型别的指针指向其子类的实例,然后通过父类的指针调用实际子类的成员函数。这种技术可以让父类的指针有“多种形态”,这是一种泛型技术。所谓泛型技术,说白了就是试图使用不变的代码来实现可变的算法。比如:模板技术,RTTI技术,虚函数技术,要么是试图做到在编译时决议,要么试图做到运行时决议。关于虚函数的使用方法,我在这里不做过多的阐述。大家可以看看相关的C+的书籍。在这篇文章中,我只想从虚函数的实现机制上面为大家 一个清晰的剖析。当然,相同的文章在网上也出现过一些了,但我总感觉这些文章不是很容易
2、阅读,大段大段的代码,没有图片,没有详细的说明,没有比较,没有举一反三。不利于学习和阅读,所以这是我想写下这篇文章的原因。也希望大家多给我提意见。言归正传,让我们一起进入虚函数的世界。虚函数表对C+ 了解的人都应该知道虚函数(Virtual Function)是通过一张虚函数表(Virtual Table)来实现的。简称为V-Table。 在这个表中,主是要一个类的虚函数的地址表,这张表解决了继承、覆盖的问题,保证其容真实反应实际的函数。这样,在有虚函数的类的实例中这个表被分配在了 这个实例的内存中,所以,当我们用父类的指针来操作一个子类的时候,这张虚函数表就显得由为重要了,它就像一个地图一样
3、,指明了实际所应该调用的函数。这里我们着重看一下这张虚函数表。在C+的标准规格说明书中说到,编译器必需要保证虚函数表的指针存在于对象实例中最前面的位置(这是为了保证正确取到虚函数的偏移量)。 这意味着我们通过对象实例的地址得到这张虚函数表,然后就可以遍历其中函数指针,并调用相应的函数。听我扯了那么多,我可以感觉出来你现在可能比以前更加晕头转向了。 没关系,下面就是实际的例子,相信聪明的你一看就明白了。假设我们有这样的一个类:class Base public:virtual void f() cout Base:f endl; virtual void g() cout Base:g endl
4、; virtual void h() cout Base:h endl; ;按照上面的说法,我们可以通过Base的实例来得到虚函数表。 下面是实际例程:typedef void(*Fun)(void);Base b;Fun pFun = NULL;/ /得到Vprt的地址,取出它的值就是Vtable的地址,如何取出呢它指向的值呢?/只要把它转换为指针,解引用就可以了/是那种类型的指针呢?/一个指针4字节,故只要是4字节的类型就可以long* vptrAdd=(long*)(&b);cout 虚函数表地址: (int*)(&b) endl;cout 虚函数表 第一个函数地址: (int*)*(i
5、nt*)(&b) endl;/ Invoke the first virtual functionpFun = (Fun)*(int*)*(int*)(&b);pFun();实际运行经果如下:(Windows XP+VS2003, Linux 2.6.22 + GCC 4.1.3)虚函数表地址:0012FED4虚函数表 第一个函数地址:0044F148Base:f通过这个示例,我们可以看到,我们可以通过强行把&b转成int *,取得虚函数表的地址,然后,再次取址就可以得到第一个虚函数的地址了,也就是Base:f(),这在上面的程序中得到了验证(把int* 强制转成了函数指针)。通过这个示例,我
6、们就可以知道如果要调用Base:g()和Base:h(),其代码如下:(Fun)*(int*)*(int*)(&b)+0); / Base:f()(Fun)*(int*)*(int*)(&b)+1); / Base:g()(Fun)*(int*)*(int*)(&b)+2); / Base:h()这个时候你应该懂了吧。什么?还是有点晕。也是,这样的代码看着太乱了。没问题,让我画个图解释一下。如下所示:注意:在上面这个图中,我在虚函数表的最后多加了一个结点,这是虚函数表的结束结点,就像字符串的结束符“0”一样,其标志了虚函数表的结束。这个结束标志的值在不同的编译器下是不同的。在WinXP+VS2
7、003下,这个值是NULL。而在Ubuntu 7.10 + Linux 2.6.22 + GCC 4.1.3下,这个值是如果1,表示还有下一个虚函数表,如果值是0,表示是最后一个虚函数表。下面,我将分别说明“无覆盖”和“有覆盖”时的虚函数表的样子。没有覆盖父类的虚函数是毫无意义的。我之所以要讲述没有覆盖的情况,主要目的是为了给一个对比。在比较之下,我们可以更加清楚地知道其内部的具体实现。一般继承(无虚函数覆盖)下面,再让我们来看看继承时的虚函数表是什么样的。假设有如下所示的一个继承关系:请注意,在这个继承关系中,子类没有重载任何父类的函数。那么,在派生类的实例中,其虚函数表如下所示:对于实例:
8、Derive d; 的虚函数表如下:上图为作者制作此图为VC6.0验证后结果(此时是虚继承基类,而作者不是虚继承)class Base public: virtual void f() cout Base:f endl; virtual void g() cout Base:g endl; virtual void h() cout Base:h endl; private : int a,b;class Derive : public virtual Basepublic: virtual void f1() cout Derive:f1 endl; virtual void g1() co
9、ut Derive:g1 endl; virtual void h1() cout Derive:h1 endl; private: int c,d;typedef void(*Fun)(void);int main(int argc, char* argv) Derive *p = new Derive(); /得到Vprt的地址,取出它的值就是Vtable的地址,如何取出呢它指向的值呢? /只要把它转换为指针,解引用就可以了. /是那种类型的指针呢? /一个指针4字节,故只要是4字节的类型就可以 long* vptrAdd = (long*)(Base*)p; cout 虚函数表地址: v
10、ptrAdd endl; /得到Vtable的地址,取到它的值,就是具体函数的地址,然后用函数指针保存,就能得到 /真实的函数地址.如何得到它的值呢? /把它转换为指针,再解引用就行. int* vtableAddr=(int*)*vptrAdd; cout 虚函数表 - 第一个函数地址: vtableAddr endl; cout 虚函数表 - 第二个函数地址: vtableAddr+1 f();由b所指的内存中的虚函数表的f()的位置已经被Derive:f()函数地址所取代,于是在实际调用发生时,是Derive:f()被调用了。这就实现了多态。多重继承(无虚函数覆盖)下面,再让我们来看看多
11、重继承中的情况,假设有下面这样一个类的继承关系。注意:子类并没有覆盖父类的函数。对于子类实例中的虚函数表,是下面这个样子:我们可以看到:1) 每个父类都有自己的虚表。2) 子类的成员函数被放到了第一个父类的表中。(所谓的第一个父类是按照声明顺序来判断的)这样做就是为了解决不同的父类类型的指针指向同一个子类实例,而能够调用到实际的函数。多重继承(有虚函数覆盖)下面我们再来看看,如果发生虚函数覆盖的情况。下图中,我们在子类中覆盖了父类的f()函数。下面是对于子类实例中的虚函数表的图:我们可以看见,三个父类虚函数表中的f()的位置被替换成了子类的函数指针。这样,我们就可以任一静态类型的父类来指向子类
12、,并调用子类的f()了。如:Derive d;Base1 *b1 = &d;Base2 *b2 = &d;Base3 *b3 = &d;b1-f(); /Derive:f()b2-f(); /Derive:f()b3-f(); /Derive:f()b1-g(); /Base1:g()b2-g(); /Base2:g()b3-g(); /Base3:g()安全性每次写C+的文章,总免不了要批判一下C+。这篇文章也不例外。通过上面的讲述,相信我们对虚函数表有一个比较细致的了解了。水可载舟,亦可覆舟。下面,让我们来看看我们可以用虚函数表来干点什么坏事吧。一、通过父类型的指针访问子类自己的虚函数我们
13、知道,子类没有重载父类的虚函数是一件毫无意义的事情。因为多态也是要基于函数重载的。虽然在上面的图中我们可以看到Base1的虚表中有Derive的虚函数,但我们根本不可能使用下面的语句来调用子类的自有虚函数:Base1 *b1 = new Derive();b1-f1(); /编译出错任何妄图使用父类指针想调用子类中的未覆盖父类的成员函数的行为都会被编译器视为非法,所以,这样的程序根本无法编译通过。但在运行时,我们可以通过指针的方式访问虚函数表来达到违反C+语义的行为。(关于这方面的尝试,通过阅读后面附录的代码,相信你可以做到这一点)二、访问non-public的虚函数另外,如果父类的虚函数是p
14、rivate或是protected的,但这些非public的虚函数同样会存在于虚函数表中,所以,我们同样可以使用访问虚函数表的方式来访问这些non-public的虚函数,这是很容易做到的。如:class Base private:virtual void f() cout Base:f endl; ;class Derive : public Base;typedef void(*Fun)(void);void main() Derive d;Fun pFun = (Fun)*(int*)*(int*)(&d)+0);pFun();结束语C+这门语言是一门Magic的语言,对于程序员来说,我们
15、似乎永远摸不清楚这门语言背着我们在干了什么。需要熟悉这门语言,我们就必需要了解C+里面的那些东西,需要去了解C+中那些危险的东西。不然,这是一种搬起石头砸自己脚的编程语言。附录一:VC中查看虚函数表我们可以在VC的IDE环境中的Debug状态下展开类的实例就可以看到虚函数表了(并不是很完整的)附录二:例程下面是一个关于多重继承的虚函数表访问的例程:#include using namespace std;class Base1 public: virtual void f() cout Base1:f endl; virtual void g() cout Base1:g endl; virt
16、ual void h() cout Base1:h endl; ;class Base2 public: virtual void f() cout Base2:f endl; virtual void g() cout Base2:g endl; virtual void h() cout Base2:h endl; ;class Base3 public: virtual void f() cout Base3:f endl; virtual void g() cout Base3:g endl; virtual void h() cout Base3:h endl; ;class Der
17、ive : public Base1, public Base2, public Base3 public: virtual void f() cout Derive:f endl; virtual void g1() cout Derive:g1 endl; ;typedef void(*Fun)(void);int main() Fun pFun = NULL; Derive d; int* pVtab = (int*)&d; /Base1s vtable /pFun = (Fun)*(int*)*(int*)(int*)&d+0)+0); pFun = (Fun)pVtab00; pFu
18、n(); /pFun = (Fun)*(int*)*(int*)(int*)&d+0)+1); pFun = (Fun)pVtab01; pFun(); /pFun = (Fun)*(int*)*(int*)(int*)&d+0)+2); pFun = (Fun)pVtab02; pFun(); /Derives vtable /pFun = (Fun)*(int*)*(int*)(int*)&d+0)+3); pFun = (Fun)pVtab03; pFun(); /The tail of the vtable pFun = (Fun)pVtab04; coutpFunendl; /Bas
19、e2s vtable /pFun = (Fun)*(int*)*(int*)(int*)&d+1)+0); pFun = (Fun)pVtab10; pFun(); /pFun = (Fun)*(int*)*(int*)(int*)&d+1)+1); pFun = (Fun)pVtab11; pFun(); pFun = (Fun)pVtab12; pFun(); /The tail of the vtable pFun = (Fun)pVtab13; coutpFunendl; /Base3s vtable /pFun = (Fun)*(int*)*(int*)(int*)&d+1)+0); pFun = (Fun)pVtab20; pFun(); /pFun = (Fun)*(int*)*(int*)(int*)&d+1)+1); pFun = (Fun)pVtab21; pFun(); pFun = (Fun)pVtab22; pFun(); /The tail of the vtable pFun = (Fun)pVtab23; coutpFunendl; return 0;
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1