admin 管理员组

文章数量: 1087859


2024年5月21日发(作者:dos和cmd的区别)

论struct的长度

2009-12-16 23:14

什么是对齐,以及为什么要对齐:

现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变

量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定

的内存地址访问,这就需要各类型数据按照一定的规则在空间上排列,而不是顺

序的一个接一个的排放,这就是对齐。

对齐的作用和原因:各个硬件平台对存储空间的处理上有很大的不同。一些平台

对某些特定类型的数据只能从某些特定地址开始存取。其他平台可能没有这种情

况,但是最常见的是如果不按照适合其平台要求对数据存放进行对齐,会在存取

效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假

设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出,

而如果存放在奇地址开始的地方,就可能会需要2个读周期,并对两次读出的结

果的高低字节进行拼凑才能得到该int数据。显然在读取效

率上下降很多。这也是空间和时间的博弈。

对齐的实现

通常,我们写程序的时候,不需要考虑对齐问题。编译器会替我们选择适合目标

平台的对齐策略。当然,我们也可以通知给编译器传递预编译指令而改变对指定

数据的对齐方法。

但是,正因为我们一般不需要关心这个问题,所以因为编辑器对数据存放做了对

齐,而我们不了解的话,常常会对一些问题感到迷惑。最常见的就是struct数

据结构的sizeof结果,出乎意料。为此,我们需要对对齐算法所了解。

对齐的算法:

由于各个平台和编译器的不同,现以本人使用的gcc version 3.2.2编译器(32

位x86平台)为例子,来讨论编译器对struct数据结构中的各成员如何进行对

齐的。

设结构体如下定义:

struct A

{

int a;

char b;

short c;

};

结构体A中包含了4字节长度的int一个,1字节长度的char一个和2字节长

度的short型数据一个。所以A用到的空间应该是7字节。但是因为编译器要对

数据成员在空间上进行对齐。

所以使用sizeof(strcut A)值为8。

现在把该结构体调整成员变量的顺序。

struct B

{

char b;

int a;

short c;

};

这时候同样是总共7个字节的变量,但是sizeof(struct B)的值却是12。

下面我们使用预编译指令#progma pack (value)来告诉编译器,使用我们指定的

对齐值来取代缺省的。

#progma pack (2) /*指定按2字节对齐*/

struct C

{

char b;

int a;

short c;

};

#progma pack () /*取消指定对齐,恢复缺省对齐*/

sizeof(struct C)值是8。

修改对齐值为1:

#progma pack (1) /*指定按1字节对齐*/

struct D

{

char b;

int a;

short c;

};

#progma pack () /*取消指定对齐,恢复缺省对齐*/

sizeof(struct D)值为7。

对于char型数据,其自身对齐值为1,对于short型为2,对于int,float,double

类型,其自身对齐值为4,单位字节。

这里面有四个概念值:

1.数据类型自身的对齐值:就是上面交代的基本数据类型的自身对齐值。

2.指定对齐值:#progma pack (value)时的指定对齐值value。

3.结构体或者类的自身对齐值:其成员中自身对齐值最大的那个值。

4.数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中小的那个值。

有了这些值,我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方

式。有效对齐值N是最终用来决定数据存放地址方式的值,最重要。有效对齐N,

就是表示“对齐在N上”,也就是说该数据的"存放起始地址%N=0".而数据结构

中的数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是

数据结构的起始地址。结构体的成员变量要对齐排放,结构体本身也要根据自身

的有效对齐值圆整(就是结构体成员变量占用总长度需要是对结构体有效对齐值

的整数倍,结合下面例子理解)。这样就不能理解上面的几个例子的值了。

例子分析:

分析例子B;

struct B

{

char b;

int a;


本文标签: 数据 地址 成员 变量 结构