C语言探索之旅 | 第二部分第八课：动态分配

-- 简书作者谢恩铭转载请注明出处

第二部分第八课：动态分配

上一课是C语言探索之旅 | 第二部分第七课：文件读写。

经历了第二部分的一些难点课程，我们终于来到了这一课，一个听起来有点酷酷的名字：

动态分配

“万水千山总是情，分配也由系统定”

到目前为止，我们创建的变量都是系统的编译器为我们自动构建的，这是简单的方式。

其实还有一种更偏手动的创建变量的方式，我们称为“动态分配”（Dynamic Allocation），dynamic是英语“动态的”之意，allocation是英语“分配”的意思。

动态分配的一个主要好处就是可以在内存中“预置”一定空间大小，在编译时还不知道到底会用多少。

使用这个技术，我们可以创建大小可变的数组。到目前为止我们所创建的数组都是大小固定不可变的。而学完这一课后我们就会创建所谓“动态数组”了。

学习这一章需要对指针有一定了解，如果指针的概念你还没掌握好，可以回去复习C语言探索之旅 | 第二部分第二课：进击的指针，C语言的王牌！那一课。

我们知道当我们创建一个变量时，在内存中要为其分配一定大小的空间。例如：

int number = 2;

当程序运行到这一行代码时，会发生几件事情：

应用程序询问操作系统（Operating System，简称OS。例如Windows，Linux，Mac OS，Android等）是否可以使用一小块内存空间。
操作系统回复我们的程序，告诉它可以将这个变量存储在内存中哪个地方（给出分配的内存地址）。
当函数结束后，你的变量会自动从内存中被删除。你的程序对操作系统说：“我已经不需要内存中的这块地址了，谢谢！” （当然，实际上你的程序不可能对操作系统说一声“谢谢”，但是确实是操作系统在掌管一切，包括内存，所以对它还是客气一点比较好...）。

可以看到，以上的过程都是自动的。当我们创建一个变量，操作系统就会自动被程序这样调用。

那么什么是手动的方式呢？说实在的，没人喜欢把事情复杂化，如果自动方式可行，何必要大费周章来使用什么手动方式呢？但是要知道，很多时候我们是不得不使用手动方式。

这一课中，我们将会：

探究内存的机制（是的，虽然以前的课研究过，但是还是要继续深入），了解不同变量类型所占用的内存大小
接着，探究这一课的主题，来学习如何向操作系统动态请求内存。也就是所谓的“动态内存分配”
最后，通过学习如何创建一个在编译时还不知道其大小（只有在程序运行时才知道）的数组来了解动态内存分配的好处

准备好了吗？Let's Go !

变量的大小

根据我们所要创建的变量的类型（char，int，double，等等），其所占的内存空间大小是不一样的。

事实上，为了存储一个大小在-128至127之间的数（char类型），只需要占用一个字节（8个二进制位）的内存空间，是很小的。

然而，一个int类型的变量就要占据4个字节了；一个double类型要占据8个字节。

问题是：并不总是这样。

什么意思呢？

因为类型所占内存的大小还与操作系统有关系，比如不同的操作系统可能就不一样，32位和64位的操作系统的类型大小一般会有区别。也许你的电脑上int类型是8个字节呢。

这一节中我们的目的是学习如何获知变量所占用的内存大小。

有一个很简单的方法：使用sizeof()

虽然看着有点像函数，但其实sizeof不是一个函数，而是一个C语言的关键字，也算是一个运算符吧。

我们只需要在sizeof的括号里填入想要检测的变量类型（注意是类型，如果是函数就不是填类型了对吗），sizeof就会返回所占用的字节数了。

例如，我们要检测int类型的大小，就可以这样写：

sizeof(int)

在编译时，sizeof(int)就会被替换为int类型所占用的字节数了。

在我的电脑上，sizeof(int)是4，也就是说int类型在我的电脑的内存中占据4个字节。在你的电脑上，也许是4，但也可能是其他的值。

我们用一个例子来测试一下吧：

// octet是英语“字节”的意思，和byte类似
printf("char : %d octets\n", sizeof(char));
printf("int : %d octets\n", sizeof(int));
printf("long : %d octets\n", sizeof(long));
printf("double : %d octets\n", sizeof(double));

在我的电脑（64位）运行，输出：

char : 1 octets
int : 4 octets
long : 8 octets
double : 8 octets

我们并没有测试所有已知的变量类型，你也可以课后自己去测试一下其他的类型，例如：short，float。

曾几何时，当电脑的内存很小的年代，有这么多不同大小的变量类型可供选择是一件很好的事，因为我们可以选“够用的最小的”那种变量类型，以节约内存。

现在，电脑的内存一般都很大，“有钱任性”么。所以我们在编程时也没必要太“拘谨”。不过在嵌入式领域，内存大小一般是有限的，我们就得斟酌着使用变量类型了。

既然sizeof这么好用，我们可不可以用它来显示我们自定义的变量类型的大小呢？例如 struct，enum，union。

是可以的。写一个程序测试一下：

#include <stdio.h>

typedef struct Coordinate
{
  int x;
  int y;
} Coordinate;

int main(int argc, char *argv[])
{
  printf("Coordinate结构体的大小是 : %d 个字节\n", sizeof(Coordinate));

  return 0;
}

运行输出：

Coordinate结构体的大小是 : 8 个字节

对于内存的全新视角

之前，我们在绘制内存图示时，还是比较不精准的。现在，我们知道了每个变量所占用的大小，我们的内存图示就可以变得更加精准了。

假如我定义一个int类型的变量：

int age = 18;

我们用sizeof测试后得知int的大小为4。假设我们的变量age被分配到的内存地址起始是1600，那么我们的内存图示就如下所示：

我们看到，我们的int型变量age在内存中占用4个字节，起始地址是1600（它的内存地址），一直到1603。

如果我们对一个char型变量（大小是一个字节）同样赋值：

char number = 18;

那么，其内存图示是这样的：

假如是一个int型的数组：

int age[100];

用sizeof()测试一下，就可以知道在内存中age数组占用400个字节。4 * 100 = 400

即使这个数组没有赋初值，但是在内存中仍然占据400个字节的空间。变量一声明，在内存中就为它分配一定大小的内存了。

那么，如果我们创建一个类型是Coordinate的数组呢？

Coordinate coordinate[100];

其大小就是 8 * 100 = 800 个字节了。

内存的动态分配

好了，现在我们就进入这一课的关键部分了，重提一次这一课的目的：学会如何手动申请内存空间。

我们需要引入 stdlib.h 这个标准库头文件，因为接下来要使用的函数是定义在这个库里面。

这两个函数是什么呢？就是：

malloc：是Memory Allocation的缩写，也就是英语“内存分配”的意思。询问操作系统能否预支一块内存空间来使用。
free：英语“解放，释放，自由的”的意思，意味着“释放那块内存空间”。告诉操作系统我们不再需要这块已经分配的空间了，这块内存空间会被释放，另一个程序就可以使用这块空间了。

当我们手动分配内存时，须要按照以下三步顺序来：

调用malloc函数来申请内存空间。
检测malloc函数的返回值，以得知操作系统是否成功为我们的程序分配了这块内存空间。
一旦使用完这块内存，不再需要时，必须用free函数来释放占用的内存，不然可能会造成内存泄漏。

以上三个步骤是不是让我们回忆起关于上一课“文件读写”的内容了？

这三个步骤和文件指针的操作有点类似，也是先申请内存，检测是否成功，用完释放。

malloc函数：申请内存

malloc分配的内存是在堆上，一般的局部变量（自动分配的）大多是在栈上。

关于堆和栈的区别，还有内存的其他区域，如静态区等，大家可以自己延伸阅读。

之前“字符串”那一课里已经给出过一张图表了。再来回顾一下吧：

名称	内容
代码段	可执行代码、字符串常量
数据段	已初始化全局变量、已初始化全局静态变量、局部静态变量、常量数据
BSS段	未初始化全局变量，未初始化全局静态变量
栈	局部变量、函数参数
堆	动态内存分配

给出malloc函数的原型，你会发现有点滑稽：

void* malloc(size_t numOctetsToAllocate);

可以看到，malloc函数有一个参数numOctetsToAllocate，就是需要申请的内存空间大小（用字节数表示），这里的size_t（之前的课程有提到过）其实和int是类似的，就是一个define宏定义，实际上很多时候就是int。

对于我们目前的演示程序，可以将sizeof(int)置于malloc的括号中，表示要申请int类型的大小的空间。

真正引起我们兴趣的是malloc函数的返回值：

void*

如果你还记得我们在函数那章所说的，void表示“空”，我们用void来表示函数没有返回值。

所以说，这里我们的函数malloc会返回一个指向void的指针，一个指向“空”（void是英语“虚无，空”的意思）的指针，有什么意义呢？malloc函数的作者不会搞错了吧？

不要担心，这么做肯定是有理由的。

难道有人敢质疑老爷子Dennis Ritchie（C语言的作者）的智商？
来人呐，拖出去... 罚写100个C语言小游戏。

事实上，这个函数返回一个指针，指向操作系统分配的内存的首地址。

如果操作系统在1600这个地址为你开辟了一块内存的话，那么函数就会返回一个包含1600这个值的指针。

但是，问题是：malloc函数并不知道你要创建的变量是什么类型的。

实际上，你只给它传递了一个参数：在内存中你需要申请的字节数。

如果你申请4个字节，那么有可能是int类型，也有可能是long类型啊。

正因为malloc不知道自己应该返回什么变量类型（它也无所谓，只要分配了一块内存就可以了），所以它会返回void*这个类型。这是一个可以表示任意指针类型的指针。

void*与其他类型的指针之间可以通过强制转换来相互转换。例如：

int *i = (int *)p; // p是一个void*类型的指针

void *v = (void *)c; // c是一个char*类型的指针

实践

如果我实际来用malloc函数分配一个int型指针：

int *memoryAllocated = NULL; // 创建一个int型指针

memoryAllocated = malloc(sizeof(int)); // malloc函数将分配的地址赋值给我们的指针memoryAllocated

经过上面的两行代码，我们的int型指针memoryAllocated就包含了操作系统分配的那块内存地址的首地址值。

假如我们用之前我们的图示来举例，这个值就是1600。

检测指针

既然上面我们用两行代码使得memoryAllocated这个指针包含了分配到的地址的首地址值，那么我们就可以通过检测memoryAllocated的值来判断申请内存是否成功了：

如果为NULL，则说明malloc调用没有成功
否则，就说明成功了

一般来说内存分配不会失败，但是也有极端情况：

你的内存（堆内存）已经不够了
你申请的内存值大得离谱（比如你申请64GB的内存空间，那我想大多数电脑都是不可能分配成功的）

希望大家每次用malloc函数时都要做指针的检测，万一真的出现返回值为NULL的情况，那我们需要立即停止程序，因为没有足够的内存，也不可能进行下面的操作了。

为了中断程序的运行，我们来使用一个新的函数：

exit()

exit函数定义在stdlib.h中，调用此函数会使程序立即停止。

这个函数也只有一个参数，就是返回值，这和return函数的参数是一样原理的。实例：

int main(int argc, char *argv[])
{
  int *memoryAllocated = NULL;

  memoryAllocated = malloc(sizeof(int));

  if (memoryAllocated == NULL) // 如果分配内存失败
  {
    exit(0); // 立即停止程序
  }

  // 如果指针不为NULL，那么可以继续进行接下来的操作

  return 0;
}

另外一个问题：用malloc 函数申请0字节内存会返回NULL 指针吗？

可以测试一下，也可以去查找关于malloc 函数的说明文档。

申请0 字节内存，函数并不返回NULL，而是返回一个正常的内存地址。
但是你却无法使用这块大小为0 的内存！

这好比尺子上的某个刻度，刻度本身并没有长度，只有某两个刻度一起才能量出长度。

对于这一点一定要小心，因为这时候if(NULL != p)语句校验将不起作用。

free函数：释放内存

记得上一课我们使用fclose函数来关闭一个文件指针，也就是释放占用的内存。

free函数的原理和fclose是类似的，我们用它来释放一块我们不再需要的内存。原型：

void free(void* pointer);

free函数只有一个目的：释放pointer指针所指向的那块内存。

实例程序：

int main(int argc, char *argv[])
{
  int* memoryAllocated = NULL;

  memoryAllocated = malloc(sizeof(int));

  if (memoryAllocated == NULL) // 如果分配内存失败
  {
    exit(0); // 立即停止程序
  }

  // 此处添加使用这块内存的代码

  free(memoryAllocated); // 我们不再需要这块内存了，释放之

  return 0;
}

综合上面的三个步骤，我们来写一个完整的例子：

#include <stdio.h>
#include <stdlib.h>

int main(int argc, char *argv[])
{
  int* memoryAllocated = NULL;

  memoryAllocated = malloc(sizeof(int)); // 分配内存

  if (memoryAllocated == NULL) // 检测是否分配成功
  {
    exit(0); // 不成功，结束程序
  }

  // 使用这块内存
  printf("您几岁了 ? ");

  scanf("%d", memoryAllocated);

  printf("您已经 %d 岁了\n", *memoryAllocated);

  free(memoryAllocated); // 释放这块内存

  return 0;
}

运行输出：

您几岁了 ? 28
您已经 28 岁了

以上就是我们用动态分配的方式来创建了一个int型变量，使用它，释放它所占用的内存。

但是，我们也完全可以用以前的方式来实现，如下:

int main(int argc, char *argv[])
{
  int myAge = 0; // 分配内存 (自动)

  // 使用这块内存
  printf("您几岁了 ? ");

  scanf("%d", &myAge);

  printf("你已经 %d 岁了\n", myAge);

  return 0;
} // 释放内存 (在函数结束后自动释放)

在这个简单使用场景下，两种方式（手动和自动）都是能完成任务的。

总结说来，创建一个变量（说到底也就是分配一块内存空间）有两种方式：自动和手动。

自动：我们熟知并且一直使用到现在的方式
手动（动态）：这一课我们学习的内容

你可能会说：“我发现动态分配内存的方式既复杂又没什么用嘛！”

复杂么？还行吧，确实相对自动的方式要考虑比较多的因素。

没有用么？绝不！

因为很多时候我们不得不使用手动的方式来分配内存。

接下来我们就来看一下手动方式的必要性。

动态分配一个数组

暂时我们只是用手动方式来创建了一个简单的变量。

然而，一般说来，我们的动态分配可不是这样“大材小用”的。

如果只是创建一个简单的变量，我们用自动的方式就够了。

那你会问：“啥时候须要用动态分配啊？”

问得好。动态分配最常被用来创建在运行时才知道大小的变量，例如动态数组。

假设我们要存储一个用户的朋友的年龄列表，按照我们以前的方式（自动方式），我们可以创建一个int型的数组：

int ageFriends[18];

很简单对吗？那问题不就解决了？

但是以上方式有两个缺陷：

你怎么知道这个用户只有18个朋友呢？可能他有更多朋友呢。
你说：“那好，我就创建一个数组：

int ageFriends[10000];

足够储存1万个朋友的年龄。”

但是问题是：可能我们使用到的只是这个大数组的很小一部分，岂不是浪费内存嘛。

最恰当的方式是询问用户他有多少朋友，然后创建对应大小的数组。

而这样，我们的数组大小就只有在运行时才能知道了。

Voila，这就是动态分配的优势了：

可以在运行时才确定申请的内存空间大小。
不多不少刚刚好，要多少就申请多少，不怕不够或过多。

所以借着动态分配，我们就可以在运行时询问用户他到底有多少朋友。

如果他说有20个，那我们就申请20个int型的空间；如果他说有50个，那就申请50个。经济又环保。

我们之前说过，C语言中禁止用变量名来作为数组大小，例如不能这样：

int ageFriends[numFriends];  // numFriends是一个变量

尽管有的C编译器可能允许这样的声明，但是我们不推荐。

我们来看看用动态分配的方式如何实现这个程序：

#include <stdio.h>
#include <stdlib.h>

int main(int argc, char *argv[])
{
  int numFriends = 0, i = 0;

  int *ageFriends= NULL; // 这个指针用来指示朋友年龄的数组

  // 询问用户有多少个朋友
  printf("请问您有多少朋友 ? ");

  scanf("%d", &numFriends);

  if (numFriends > 0) // 至少得有一个朋友吧，不然也太惨了 :P
  {
    ageFriends = malloc(numFriends * sizeof(int)); // 为数组分配内存
    if (ageFriends== NULL) // 检测分配是否成功
    {
      exit(0); // 分配不成功，退出程序
    }

    // 逐个询问朋友年龄
    for (i = 0 ; i < numFriends; i++)  {
      printf("第%d位朋友的年龄是 ? ", i + 1);
      scanf("%d", &ageFriends[i]);
    }

    // 逐个输出朋友的年龄
    printf("\n\n您的朋友的年龄如下 :\n");
    for (i = 0 ; i < numFriends; i++) {
      printf("%d 岁\n", ageFriends[i]);
    }

    // 释放malloc分配的内存空间，因为我们不再需要了
    free(ageFriends);
  }

  return 0;
}

运行输出：

请问您有多少朋友 ? 7
第1位朋友的年龄是 ? 25
第2位朋友的年龄是 ? 21
第3位朋友的年龄是 ? 27
第4位朋友的年龄是 ? 18
第5位朋友的年龄是 ? 14
第6位朋友的年龄是 ? 32
第7位朋友的年龄是 ? 30

您的朋友的年龄如下 :
25岁
21岁
27岁
18岁
14岁
32岁
30岁

当然了，这个程序比较简单，但我向你保证以后的课程会使用动态分配来做更有趣的事。

总结

不同类型的变量在内存中所占的大小不尽相同。
借助sizeof这个关键字（也是运算符）可以知道一个类型所占的字节数。
动态分配就是在内存中手动地预留一块空间给一个变量或者数组。
动态分配的常用函数是malloc（当然还有calloc，realloc，可以查阅使用方法，和malloc是类似的），但是在不需要这块内存之后，千万不要忘了使用free函数来释放。而且，malloc和free要一一对应，不能一个malloc对应两个free，会出错；或者两个malloc对应一个free，会内存泄露！
动态分配使得我们可以创建动态数组，就是它的大小在运行时才能确定。

第二部分第九课预告：

今天的课就到这里，一起加油吧。

下一次我们学习： C语言探索之旅 | 第二部分第九课：实战"悬挂小人"游戏