本系列文章为笔者在校学习《数据库原理及应用》课程所作的课程笔记,文中大部分内容参考王珊
的《数据库系统概论》
一、数据库系统概述
1、常用术语和基本概念
1.1、数据 Data
数据是数据库中存储的基本对象。
1.2、数据库 DataBase,DB
存放数据的仓库,特点:
- 永久存储
- 有组织
- 可共享
1.3、数据库管理系统 Database Manager System,DMS
科学的组织和存储数据,高效的获取和维护数据。
数据库管理系统和操作系统一样是计算机基础软件,是一个大型复杂的软件系统。
主要功能:
- 数据定义功能:提供数据定义语言
Data Definition Language
,DLL
:通过它可以方便的对数据库中的存储对象进行定义; - 数据
组织、存储、管理
:数据组织和存取的基本目标是提高存储空间利用率和方便存取; - 数据操纵功能:提供数据操纵语言
Data Manipulation Language
,DML
:可以实现对数据库的基本操作,如增删改查; - 数据库的事物管理和运行管理:保证数据的安全性、完整性、处理并发;
- 数据库的建立和维护功能:数据库初始数据的输入、转换功能,数据库的转储、恢复功能等等;
1.4、数据库系统 Database System,DBS
数据库系统是指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统及其开发工具、引用系统、数据库管理员组成;Database Administrator
,DBA。
- 数据管理技术经过了人工管理、文件系统、数据库系统3个阶段。
2、数据库系统的特点
-
数据结构化;
-
数据的共享度高、冗余度低、易扩充;
-
数据独立性高;
数据独立性是数据库领域中一个常用属于和重要概念,包括数据的物理独立性和逻辑独立性。
物理独立性
是指用户的应用程序和存储在硬盘上的数据库中的数据是相互独立的;逻辑独立性
是指用户的应用程序与数据库的逻辑结构是相互独立的。
-
数据由 DBMS 统一管理和控制;
二、数据模型
- 数据模型是对现实世界数据特征的抽象。
- 通俗地讲数据模型就是现实世界的模拟。
- 数据模型是数据库系统的
核心
和基础
。
1、两类数据模型
1.1、概念模型
也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计。
1.2、逻辑模型和物理模型
- 逻辑模型主要包括
网状模型
、层次模型
、关系模型
、面向对象数据模型、对象关系数据模型、半结构化数据模型等。按计算机系统的观点对数据建模,用于DBMS实现。 - 物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。
抽象过程-两步抽象:
- 现实世界中的客观对象抽象为概念模型:将现实世界抽象为信息世界。
- 把概念模型转换为某一数据库管理系统支持的数据模型:将信息世界转换为机器世界
2、概念模型
概念模型的用途:
- 概念模型用于信息世界的建模
- 是现实世界到机器世界的一个中间层次
- 是数据库设计的有力工具
- 数据库设计人员和用户之间进行交流的语言
-
信息世界中的基本概念
实体
(Entity)属性
(Attribute)- 码(Key)
- 实体型(Entity Type)
- 实体集(Entity Set)
联系
(Relationship)
实体之间的联系有一对一、一对多和多对多等多种类型
-
概念模型的一种表示方法:实体-联系方法
E-R
3、数据模型的组成要素
- 数据结构
- 数据操作
- 数据的完整性约束条件
3.1、数据模型的数据结构
描述数据库的组成对象,以及对象之间的联系
描述的内容:
- 与对象的类型、内容、性质有关
- 与数据之间联系有关
数据操作是对系统静态特性的描述
3.2、数据操作
对数据库中各种对象(型
)的实例(值
)允许执行的操作的集合,包括操作及有关的操作规则。
数据操作的类型:
- 查询
- 更新(包括插入、删除、修改)
数据模型对操作的定义:
- 操作的确切含义
- 操作符号
- 操作规则(如优先级)
- 实现操作的语言
数据操作是对系统动态特性的描述
3.3、数据的完整性约束条件
- 一组完整性规则的集合;
- 完整性规则:给定的数据模型中数据及其联系所具有的制约和依存规则;
- 用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。
数据模型对完整性约束条件的定义:
- 反映和规定必须遵守的
基本的通用的
完整性约束条件。 - 提供定义完整性约束条件的机制,以反映
具体应用
所涉及的数据必须遵守的特定的语义约束条件。
4、常用的数据模型
- 层次模型(
Hierarchical
Model) - 网状模型(
Network
Model) - 关系模型(
Relational
Model) - 面向对象数据模型(Object Oriented Data Model)
- 对象关系数据模型(Object Relational Data Model)
- 半结构化数据模型(Semistruture Data Model)
4.1、层次模型
层次模型是数据库系统中最早出现的数据模型
层次数据库系统的典型代表是IBM公司的 IMS(Information Management System)数据库管理系统。
层次模型用树形结构
来表示各类实体以及实体间的联系。
1、层次模型的数据结构
满足下面两个条件的基本层次联系的集合为层次模型:
- 有且只有一个结点没有双亲结点,这个结点称为
根结点
- 根以外的其它结点有且只有一个双亲结点
层次模型的特点:
- 结点的双亲是唯一的
- 只能直接处理一对多的实体联系
- 每个记录类型可以定义一个排序字段,也称为码字段
- 任何记录值只有按其路径查看时,才能显出它的全部意义
- 没有一个子女记录值能够脱离双亲记录值而独立存在
层次模型的数据操纵:
- 查询
- 插入
- 删除
- 更新
层次模型的完整性约束条件:
- 无相应的双亲结点值就不能插入子女结点值
- 如果删除双亲结点值,则相应的子女结点值也被同时删除
- 更新操作时,应更新所有相应记录,以保证数据的一致性
层次模型的优缺点:
优点:
- 层次模型的数据结构比较简单清晰
- 查询效率高,性能优于关系模型,不低于网状模型
- 层次数据模型提供了良好的完整性支持
缺点:
- 结点之间的多对多联系表示不自然
- 对插入和删除操作的限制多,应用程序的编写比较复杂
- 查询子女结点必须通过双亲结点
- 层次命令趋于程序化
4.2、网状模型
网状数据库系统采用网状模型
作为数据的组织方式。
1、网状模型的数据结构
满足下面两个条件的基本层次联系的集合:
- 允许一个以上的结点无双亲;
- 一个结点可以有多于一个的双亲。
表示方法(与层次数据模型相同):
实体型
:用记录类型描述每个结点表示一个记录类型(实体)属性
:用字段描述每个记录类型可包含若干个字段联系
:用结点之间的连线表示记录类型(实体)之间的一对多的父子联系
层次模型实际上是网状模型的一个特例
2、网状模型的操纵与完整性约束
网状数据库系统(如DBTG)对数据操纵加了一些限制,提供了一定的完整性约束:
- 码:唯一标识记录的数据项的集合
- 一个联系中双亲记录与子女记录之间是一对多联系
- 支持双亲记录和子女记录之间某些约束条件
3、网状模型的优缺点
优点:
- 能够更为直接地描述现实世界,如一个结点可以有多个双亲;
- 具有良好的性能,存取效率较高;
缺点:
- 结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握;
- DDL、DML语言复杂,用户不容易使用;
- 记录之间联系是通过存取路径实现的,用户必须了解系统结构的细节。
4.3、关系模型
关系数据库系统采用关系模型作为数据的组织方式
1970年美国IBM公司San Jose研究室的研究员E.F.Codd首次提出了数据库系统的 关系模型。
1、关系模型的数据结构
在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。
- 关系(Relation):一个关系对应通常说的一张表
- 元组(Tuple):表中的一行即为一个元组
- 属性(Attribute):表中的一列即为一个属性,给每一个属性起一个名称即属性名
- 主码(Key):也称码键。表中的某个属性组,它可以唯一确定一个元组
- 域(Domain):是一组具有相同数据类型的值的集合。属性的取值范围来自某个域。
- 分量:元组中的一个属性值。
- 关系模式:对关系的描述
关系必须是规范化的,满足一定的规范条件
关系的每一个分量必须是一个不可分的数据项, 不允许表中还有表
。
2、关系模型的操纵与完整性约束
数据操作是集合操作,操作对象和操作结果都是关系:
- 查询
- 插入
- 删除
- 更新
关系的完整性约束条件:
- 实体完整性
- 参照完整性
- 用户定义的完整性
3、关系模型的优缺点
优点:
- 建立在严格的数学概念的基础上
- 概念单一
- 关系模型的存取路径对用户透明
缺点:
- 存取路径对用户透明,查询效率往往不如格式化数据模型
- 为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度
三、数据库系统的结构
1、模式的概念
模式(Schema)
- 数据库逻辑结构和特征的描述
- 是型的描述,不涉及具体值
- 反映的是数据的结构及其联系
- 模式是相对稳定的
实例(Instance)
- 模式的一个具体值
- 反映数据库某一时刻的状态
- 同一个模式可以有很多实例
- 实例随数据库中的数据的更新而变动
例如:
在学生选课数据库模式
中,包含:
- 学生记录
- 课程记录和
- 学生选课记录
2020年的一个学生数据库实例
,包含:
- 2020年学校中所有学生的记录
- 学校开设的所有课程的记录
- 所有学生选课的记录
2、三级模式结构
- 模式(Schema)
- 外模式(External Schema)
- 内模式(Internal Schema)
2.1、模式(也称逻辑模式)
- 数据库中全体数据的逻辑结构和特征的描述
- 所有用户的公共数据视图
一个数据库只有一个模式
模式的地位:是数据库系统模式结构的中间层
- 与数据的物理存储细节和硬件环境无关
- 与具体的应用程序、开发工具及高级程序设计语言无关
模式的定义
- 数据的逻辑结构(数据项的名字、类型、取值范围等)
- 数据之间的联系
- 数据有关的安全性、完整性要求
2.2、外模式(External Schema)
外模式(也称子模式
或用户模式)
- 数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述
- 数据库用户的数据视图,是与某一应用有关的数据的逻辑表示
外模式的地位:介于模式与应用之间
模式与外模式的关系:一对多
- 外模式通常是模式的子集
- 一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求
- 对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同
外模式与应用的关系:一对多
- 同一外模式也可以为某一用户的多个应用系统所使用
- 但一个应用程序只能使用一个外模式
外模式的用途
- 保证数据库安全性的一个有力措施
- 每个用户只能看见和访问所对应的外模式中的数据
2.3、内模式(Internal Schema)
内模式(也称存储模式
)
是数据物理结构
和存储方式
的描述,是数据在数据库内部的表示方式:
- 记录的存储方式(例如,顺序存储,按照B树结构存储,按hash方法存储等)
- 索引的组织方式
- 数据是否压缩存储
- 数据是否加密
- 数据存储记录结构的规定
一个数据库只有一个内模式
3、数据库的二级映像功能与数据独立性
三级模式是对数据的三个抽象级别
二级映象在数据库管理系统内部实现这三个抽象层次的联系
和转换
:
- 外模式/模式映像
- 模式/内模式映像
3.1、外模式/模式映像
模式:描述的是数据的全局逻辑结构
外模式:描述的是数据的局部逻辑结构
- 同一个模式可以有任意多个外模式
- 每一个外模式,数据库系统都有一个外模式/模式映象,定义外模式与模式之间的对应关系
- 映象定义通常包含在各自外模式的描述中
保证数据的逻辑独立性
- 当模式改变时,数据库管理员对外模式/模式映象作相应改变,使外模式保持不变
- 应用程序是依据数据的外模式编写的,应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的
逻辑独立性
3.2、模式/内模式映像
模式/内模式映象定义了数据全局逻辑结构
与存储结构
之间的对应关系。
- 例如,说明逻辑记录和字段在内部是如何表示的
数据库中模式/内模式映象是唯一的
该映象定义通常包含在模式描述中;
保证数据的物理独立性:
- 当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变。
- 应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性。
4、小结
数据库模式
- 即全局逻辑结构是数据库的中心与关键
- 独立于数据库的其他层次
- 设计数据库模式结构时应首先确定数据库的逻辑模式
数据库的内模式
- 依赖于它的全局逻辑结构
- 独立于数据库的用户视图,即外模式
- 独立于具体的存储设备
- 将全局逻辑结构中所定义的数据结构及其联系按照一定的物理存储策略进行组织,以达到较好的时间与空间效率
数据库的外模式
- 面向具体的应用程序
- 定义在逻辑模式之上
- 独立于存储模式和存储设备
- 当应用需求发生较大变化,相应外模式不能满足其视图要求时,该外模式就得做相应改动
- 设计外模式时应充分考虑到应用的扩充性
特定的应用程序
- 在外模式描述的数据结构上编制的
- 依赖于特定的外模式
- 与数据库的模式和存储结构独立
- 不同的应用程序有时可以共用同一个外模式
数据库的二级映像
- 保证了数据库外模式的稳定性
- 从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改
数据与程序之间的独立性,使得数据的定义和描述可以从应用程序中分离出去
数据的存取由数据库管理系统管理
- 简化了应用程序的编制
- 大大减少了应用程序的维护和修改
四、数据库系统的组成
- 数据库
- 数据库管理系统(及其开发工具)
- 应用程序
- 数据库管理员
由硬件平台及数据库
、软件
、人员
组成。
1、硬件
数据库系统对硬件资源的要求:
- 足够大的内存
- 足够的大的磁盘或磁盘阵列等设备
- 较高的通道能力,提高数据传送率
2、软件
- 数据库管理系统
- 支持数据库管理系统运行的操作系统
- 与数据库接口的高级语言及其编译系统
- 以数据库管理系统为核心的应用开发工具
- 为特定应用环境开发的数据库应用系统
3、人员
- 数据库管理员
- 系统分析员和数据库设计人员
- 应用程序员
- 最终用户