先看一个结构体:
typedef struct Test
{
char a1;
int a2;
char a3;
short a4;
}Test_T;
在32位编译系统下这一个结构体的字节数是多少呢?是1+4+1+2=8字节吗?不是的,实际结果为12字节。为什么呢?因为编译器会对不足4字节的变量空间自动补齐为4个字节(这就是内存对齐),以提高CPU的寻址效率(32位CPU以4个字节步长寻址的)。
内存对齐是编译器的“管辖范围”。编译器为程序中的每个”数据单元“安排在适当的位置上,以便于能快速的找到每个“数据单元”。对于32bit的CPU,其寻址的步长为4个字节(即unsigned int 字节长度),这就是常说的“4字节对齐”。同理,对于64bit的CPU,就有“8字节对齐”。本文以32位的CPU为例。
请看下面代码:
#include <stdio.h>
typedef struct Test
{
char a1;
int a2;
char a3;
short a4;
}Test_T;
int main(void)
{
Test_T T;
printf("\nsizeof(T) = %d\n", sizeof(T));
printf("a1地址:%d\n", (unsigned int)&T.a1);
printf("a2地址:%d\n", (unsigned int)&T.a2);
printf("a3地址:%d\n", (unsigned int)&T.a3);
printf("a4地址:%d\n", (unsigned int)&T.a4);
return 0;
}
运行结果为:
可见,正好印证了上述的说法,补齐之后结构体成员a1,a2,a3的地址之间正好相差4个字节,a3与a4之间相差两个字节也是因为在其中多留出了1个空白字节。该程序的运行结果可形象地描述为下图:
a1只占用一个字节,为了内存对齐保留了三个空白字节;a3和a4加起来共3字节,为了内存对齐保留了1个空白字节。这就是编译器存储变量时做的见不得人的”手脚“,以方便其雇主——CPU能更快地找到这些变量。