2019数据库面试题：三大范式理解（实例超全解析）

一、数据库第一范式：

数据库表的每一列都是不可分割的基本数据项，同一列中不能有多个值，即实体中的某个属性不能有多个值或者不能有重复的属性。（保持数据的原子性）

数据原子性很好理解，就是表中的字段不可再分。

这是一张简单的员工信息表，其中有工号、姓名、电话三个字段。通过电话这个字段获得的信息有可能是家庭电话，或是工作地点的电话，或是手机，因此表达的信息并不明确，我们可以改成这样：

在满足第一范式的基础上，实体的每个非主键属性完全函数依赖于主键属性（消除部分依赖）

主键：凡是接触过数据库的人，肯定都会知道主键，主键明确标识了每条记录，一般是一个字段，也可以由两个或两个字段组成。

依赖：对于X的每个值，Y都有一个值与之对应，反过来则不一定不成立，这叫做X函数决定Y，Y函数依赖X（X往往是主键）。

还拿上面的那张表举来说，对于每个工号，都有一个姓名与之对应，即工号决定姓名，姓名依赖工号；但由于员工之间可能有重名，一个姓名可能对应多个工号，所以姓名不能决定工号。

部分依赖：当主键由两个或两个以上字段构成，而表中的某些信息通过主键的一个字段就能唯一确定，我们称这样的依赖关系为部分依赖

学生选课（学号，姓名，专业，课程号，课程名，成绩），该表中一个学生可以选多门课，一门课有多个学生。学号和课程号可以唯一确定一条记录，因此用学号和课程号做主键。

表中的姓名、专业通过主键中的学号就能唯一确定，而课程名通过课程号唯一确定，这就是部分依赖，这样的设计不符合第二范式。

不符合第二范式会带来哪些问题呢？

1、数据信息冗余，可见上表

2、增删改会出现问题，比如有一门《微机原理》没有人选，那么由于缺少学号（主键之一）那么这门课就不能出现在表里。

如何解决呢，我们可以用关系分解的方法消除部分依赖，将上表改成如下三张表：

在满足第二范式的基础上，在实体中不存在非主键属性传递函数依赖于主键属性。（表中字段[非主键]不存在对主键的传递依赖）

传递依赖：A依赖于B，B依赖于C，就可以说A依赖C。看这样一张表：

这张表中有如下决定关系：学号–>姓名，性别，系号–>决定系名，宿舍号–>决定宿舍电话，也有学号–>系名，学号–>宿舍电话。

在这样一张表中则存在着传递依赖。也就是系名依赖系号，系号依赖学号，那么间接的系名依赖学号，宿舍号、宿舍电话和学号之间也有同样的关系。这样设计表的同样会带来数据冗余，操作异常等问题。那么我们同样可以用关系分解的分解的方法来消除传递依赖，将这张表分成三张表：

**

没有冗余的数据库未必是最好的数据库，有时为了提高运行效率，就必须降低范式标准，适当保留冗余数据。

具体做法是：在概念数据模型设计时遵守第三范式，降低范式标准的工作放到物理数据模型设计时考虑。降低范式就是增加字段，允许冗余。订单和订单项、相册浏览次数和照片的浏览次数。