范式的定义

  • 关系型数据库中的关系是需要满足一定条件的,满足这些不同程度的规范化就叫做范式。

  • 范式按照规范化程度从低到高排序为第一范式,第二范式,第三范式,BC范式,第四范式,第五范式。

前导知识

函数依赖

R(U)是属性集U的关系模型,X,Y是U的一个子集,对于R(U)中的任一个关系r,不可能存在两个元组在X上属性值相同,而在Y上属性值不同。则称X函数确定Y,或Y函数依赖X。

  • 说人话:U是表(可能不止一个表,可以是有关系的多个表)的所有列,X,Y分别是这些属性列的一个子集,也就是若干个属性,对于所有在X这些属性上的值一样的行,在Y上的属性上也必须一样,满足这样条件的这若干个属性 X和Y叫称其函数依赖。
  • X相同则Y必须相同,但X不同Y可以相同,也可以不同
  • 如果Y是X的子集,就叫平凡的函数依赖,一般不考虑这种,因为就是废话,X整个都相同,子集肯定相同。
  • 如果Y不是X的子集,叫做非平凡的函数依赖
  • 如果Y函数依赖X,那么X称为决定因素。
  • 如果Y函数依赖X,但不依赖X的任何一个真子集,也就是X是极小的,那就称Y完全函数依赖X,否则称Y部分函数依赖X
  • 如果X决定Y,Y决定Z,且Y不决定X,那么称Z对X传递函数依赖

码(键)

  • U是属性全集,K是U的子集,若U完全函数依赖K,则称K为候选码,候选码若有多个,任意选择一个都可作为主码,若U部分函数依赖K,则称K为超码。显然,候选码当然也是超码,而且是最小的超码。
  • 包含在任何一个候选码的属性都叫主属性,其他都叫非主属性
  • 在本书中主码和候选码统称为,属性集K不是该关系模式(表)的码,而是另一个关系模式(表)的码,则称K为该关系模式(表)的外码

求候选码

例子:

举例

有这样一个配件管理表WPE(WNO,PNO,ENO,QNT),其中WNO表示仓库号,PNO表示配件号,ENO表示职工号,QNT表示数量。

有以下约束要求:

(1)一个仓库有多名职工;

(2)一个职工仅在一个仓库工作;

(3)每个仓库里一种型号的配件由专人负责,但一个人可以管理几种配件;

(4)同一种型号的配件可以分放在几个仓库中。

分析表中的函数依赖关系,可以得到:

(1)ENO->WNO;

(2)(WNO,PNO)->QNT

(3)(WNO,PNO)->ENO

(4)(ENO,PNO)->QNT

观察法?:

候选码的定义就是一组能决定所有列(某一个元组)的属性。

所以根据这4个函数依赖关系,(WNO,PNO)显然肯定是,因为它可以决定QNT,也可以决定ENO,加上它本身,就是属性全集U了。

而(ENO,PNO),虽然只有一个决定QNT,但是ENO可以单独决定WNO,所以显然(ENO,PNO)也就能一起决定QNT和WNO,因此也是候选码。

六大范式?

第一范式

定义

满足最基本的条件,每一个分量都是不可分的数据项。

  • 说人话,每一列对应只有一个值。

第二范式

定义

R属于第一范式,且每一个非主属性完全函数依赖于任何一个候选码,则R属于第二范式

  • 说人话,除了主码候选码之外的其他属性都要完全函数依赖于主码。
  • 因为任意一个候选码都能作为主码,所以,也就是说,如果存在某个属性不是完全函数依赖于某一个候选码,可能是部分函数依赖,那就没了。
  • 比如主键是(学号,课程号),但是现在有一个属性完全函数依赖于学号,而部分函数依赖于(学号,课程号),那就不满足第二范式。

第三范式

定义

R属于第二范式,若R中不存在码X,属性子集Y,非主属性Z,使得X决定Y,Y不决定X,Y决定Z,则R属于第三范式。

  • 说人话,非主属性必须直接完全函数依赖于主键,中间不能有其他函数,即不能是传递函数依赖。

BC范式

定义

R属于第一范式,若X决定Y,且Y不是X的子集时X必含有码,即每一个决定因素都包含码,则R属于BC范式。

  • 说人话, 若R是第一范式,且每个属性不部分函数依赖于候选码也不传递函数依赖于候选码,则R是BC范式,具体以下三点。
    • 所有非主属性对每一个码都是完全函数依赖。(也是第二范式要求)
    • 所有主属性对每一个不包含它的码也是完全函数依赖。(也就是排除了所有属性对码的部分依赖)
    • 没有任何属性完全函数依赖于非码的任何一组属性。(排除传递函数依赖)
  • 实际上,BC范式就是在第三范式的基础上消除了主属性的传递依赖

第四范式

多值依赖

  • 说人话,多值依赖就是一个表中多对多的关系,如果可以分成两列,这两列多对多,这就平凡的多值依赖,如果是分成三列,固定某一列的值,其他两列多对多,这就是非平凡的多值依赖,第四范式要消除的就是非平凡的多值依赖。

  • 函数依赖是特殊的多值依赖,因为多对多其实也是一对多。

定义

R属于第一范式,对应R的每一个非平凡多值依赖,X->->Y,X都含有码,则R属于第四范式。

  • 说人话,在满足第三范式的基础上,关系表中不能含有一个实体的两个或多个相互独立的多值因子。dalao博客
  • 或者说,满足第四范式即要求每个非平凡的多值依赖都含有码,也就是实际上是函数依赖。

第五范式

定义

第五范式是指关系模式R依赖均由R候选码所隐含。

这辈子应该不会用到的内容,就不管了。