• 结构体大小的计算往往是面试笔试常考的知识。对于简单的结构体,可以一眼看出来,对于复杂的结构体,该如何计算结构体占用内存的大小呢?
  • 本文学习所使用的编译器是gcc 4.4.5 使用其他编译器或者使用Windows 上的编译器有可能不太一样。

1 什么是内存对齐?

先来加单的说一下为什么需要内存对齐:

  1. CPU对内存的读取不是连续的,而是分成块读取的,块的大小只能是1,2,4,8,16…字节
  2. 当读取的数据未对齐,则需要两次总线周期来访问内存才能将整个数据读完,这样会降低CPU性能
  3. 某些硬件平台只能从规定的相对地址处读取特定类型的数据,否则产生硬件异常

什么是内存对齐?

  • 不同类型的数据在内存中按照一定的规则排列
  • 但是不一定是顺序的一个接一个的排列

例如下图中的两个结构体的大小是不一样的,因为它们的内存布局是不一样的:

它们的内存布局如下图:

拓展: #pragma pack 用于指定内存的对齐方式。用于修改编译器的默认对齐方式
一般来讲,在Linux系统中,编译器的默认对我方式是4字节对齐。下图中的代码,可以将对齐方式修改为1字节对齐:

2 struct占用的内存大小如何计算

对于不同的内存对齐方式,上面的结构体在内存中的布局是不一样的,那么我们如何来计算不同的对齐方式在内存中的布局是什么样的呢?

需要根据以下三点:

  1. 第一个struct成员永远起始于 0偏移处

  2. 每个成员按其类型大小和pack参数中较小的一个 进行对齐

    2.1 偏移地址必须能被对齐参数整除
    2.2 如果一个结构体中有一个变量也是结构体,那么这个内部的结构体成员的对齐大小就按照其内部最大的数据成员作为其大小来计算。(这里有点绕,看最后的一个例子就会明白)

  3. 结构体总长度,必须为所有对齐参数的整数倍

  • 只需要按照上述三点计算方法,就可以计算出所有结构体的大小以及内存布局的样式

2.1 struct结构体大小计算案例分析-结构体中没有结构体

如下面的代码:

  • 24-3.c
#include <stdio.h>

#pragma pack(2)
struct Test1
{
    char  c1;
    short s;
    char  c2;
    int   i; 
};
#pragma pack()

#pragma pack(4)
struct Test2
{
    char  c1;
    char  c2;
    short s;
    int   i;
};
#pragma pack()

int main()
{
    printf("sizeof(Test1) = %d\n", sizeof(struct Test1));
    printf("sizeof(Test2) = %d\n", sizeof(struct Test2));

    return 0;
}
  • 编译运行结果为:

sizeof(Test1) = 10
sizeof(Test2) = 8

  • 结果分析1–Test1:

对于结构体Test1,2字节对齐,按照上述三个计算条件有:

struct Test1
{              //对齐方式 大小 起始地址 占用的内存地址位置 
    char  c1;       2          大于     1            0                            0            
    short  s;       2          等于     2            2(被对齐参数2整除)            2~3           
    char  c2;       2          大于     1(对齐参数)   4                            4            
    int   i;        2(对齐参数) 小于     4            6(被对齐参数2整除)            6~9
};  
  1. Test1的对齐方式是2字节。

然后根据:

  1. 每个成员按其类型大小和pack参数中较小的一个 进行对齐。比如上面的起始地址计算那里,都是被对齐参数2整除,这个2是类型大小和pack参数中较小的一个

    2.1 偏移地址必须能被对齐参数整除

这一条规则计算每个成员的起始地址。如上面的计算。

  1. 最后再看总体大小是否是对齐参数的整数倍。上面Test1 大小是10,是对齐参数2的整数倍
  • 结果分析2–Test2

对于结构体Test2,4字节对齐,按照上述三个计算条件有:

struct Test2
{              //对齐方式 大小 起始地址 占用的内存地址位置 
    char  c1;       4      大于    1(对齐参数)       0                             0            
    char  c2;       4      大于    1(对齐参数)       1(被对齐参数1整除)             1           
    short s;        4      大于    2(对齐参数)       2(被对齐参数2整除)             2~3          
    int   i;        4      等于    4(对齐参数)       4(被对齐参数4整除)             5~7
};
  1. Test2 的对齐方式是4字节对齐

然后再根据:

  1. 每个成员按其类型大小和pack参数中较小的一个 进行对齐。比如上面的起始地址计算那里,对齐参数分别为1,1,2,4

    2.1 偏移地址必须能被对齐参数整除

这一条规则计算每个成员的起始地址。如上面的计算。

  1. 最后再看总体大小是否是对齐参数的整数倍。上面Test2 大小是8,是对齐参数4的整数倍

经过上面的两个结构体大小的计算,可以很容易的画出其内存图

2.2 struct结构体大小计算案例分析-结构体中有一个结构体成员

再看一个复杂的结构体大小的计算

  • 代码 24-4.c
#include <stdio.h>

struct S1
{
    short a;
    long b;
};

struct S2
{
    char c;
    struct S1 d;
    double e;
};


int main()
{
    printf("sizeof(struct S1) = %d\n", sizeof(struct S1));
    printf("sizeof(struct S2) = %d\n", sizeof(struct S2));
    
    return 0;
}

运行结果为:

sizeof(struct S1) = 8
sizeof(struct S2) = 20

S1很好分析。下面我们分析S2

struct S2         //对齐方式 大小 起始地址 占用的内存地址位置
{
    char c;           4      大于     1(对齐参数)                0                0 
    struct S1 d;      4      等于     4(这个是S1中最大参数大小)   4(4整除)       4~11(S1实际大小为8double e;         4(对齐)小于     8                         12(4整除)      12~19 
      };

注意: 上面S2中的S1实际大小是8,那个4是作为与对齐方式比较时(选取较小的作为对齐参数)选取S1中最大的数据成员大小。

  1. S2 的对齐方式是4字节对齐

然后再根据:

  1. 每个成员按其类型大小和pack参数中较小的一个 进行对齐。比如上面的起始地址计算那里,对齐参数分别为0,4,12

    2.1 偏移地址必须能被对齐参数整除
    2.2 如果一个结构体中有一个变量也是结构体,那么这个内部的结构体成员的对齐大小就按照其内部最大的数据成员作为其大小来计算

这一条规则计算每个成员的起始地址。如上面的计算。

  1. 最后再看总体大小是否是对齐参数的整数倍。上面S2 大小是20,是对齐参数4的整数倍

我所使用的编译器gcc 4.4.5 不支持8字节对齐方式

3 总结

注意好好理解上述计算结构体大小的计算方法。然后自己画画内存图。