数据库的基本原理

学习数据库,第一步就是先打好基础,数据库原理是计算机科班的一门必修课,非科班的我选择的是自学,我当时是通过看老杜讲的MySQL基础,配合大学教材《数据库系统概论》来自学的。

书籍教材这种东西,肯定还是偏理论的一点,相比来说,看在线教程学习mysql更容易理解。

数据库是干嘛的?

数据库的功能就是用来组织数据,组织很多很多的数据。

这些数据通常都是存储在外存(磁盘)数据库提供的核心功能,也就是针对数据的增删改查~

学习数据库我们主要了解的内容主要包含几个方面:

1、数据库模型有哪些:包括层次模型、网状模型和关系模型,我们所用的关系型数据库就是基于关系模型实现的。

2、关系数据库的基础和sql:了解关系数据库的基本概念,了解sql的基本使用方法,至少CRUD和一些常见用法要搞懂。

3、数据库的安全性和完整性,这两部分内容其实理论的东西比较枯燥,实际上对应到实际场景中,安全性就是要保护数据的安全,包括权限控制和数据备份,而完整性则是通过一些约定和规范来限制数据库的存储内容,比如我们可以用主键、唯一键、非空等要求来限制字段的取值。

4、关系数据理论。这部分内容很有意思,也比较复杂,讲到了数据库的范式理论,从一范式到四范式,各有各的用法和要求,某互联网公司“第四范式”就是用这个概念来命名的。

5、事务和锁,最后一部分内容,就是数据库的两个重要组成部分,事务和锁,事务可以保证一组数据库操作的ACID特性,非常适用于需要数据一致性的场景,而数据库的锁不但是实现事务的基础,还可以灵活地适用于不同的数据库应用场景,我们还可以通过sql语句来完成加锁和释放,对于并发场景尤其管用。

MySQL的实现原理

学习完了数据库基础之后,接下来就该正式学习MySQL了,毕竟很多时候我们的数据库应用就是MySQL。

其实MySQL里的很多知识点和我们上面提到的数据库基础大同小异,而回到MySQL的实现层,我们就得来看看MySQL的存储引擎了。

MySQL的存储引擎分为innodb和myisam,相信大家对于这两个引擎区别的面试题看了也不少,比如innodb支持事务,支持行级锁,而myisam不支持。

由于现在innodb基本上是主流,所以我们讨论MySQL的时候基本上就是在讨论innodb。

对于MySQL的实现原理,我认为大概有这么一些内容需要我们去学习。

首先,我们了解MySQL里有哪些数据类型,一般的用法如何,然后,尝试用MySQL去跑一些sql语句,建库建表,加索引加主键,总之,这些实践能帮助你更好地学习上述内容。

想要更好地了解MySQL的原理,我们就必须要了解MySQL的整体架构,一般来说,MySQL从上到下可以分为这么几层

  • 客户端

也就是我们经常用的可视化工具,比如Navicat for MySQL

  • 服务端

就是我们安装的MySQL程序,其实打开它它就是一个MySQL的服务端进程

  • sql执行层

sql执行层主要负责解析执行sql,里面包含了很多复杂的组成部分,比如解释器,分析器,优化器等等,执行层会生成一个sql的执行计划,这个计划也经常是我们分析sql性能的一个重要参考内容

  • 存储引擎层

存储引擎层是innodb了,比如数据要如组织和存放,索引要如何建立和管理等等,加锁怎么加,事务如何实现,都是这一层要考虑的内容。

  • 文件系统层

存储引擎的下一层就是文件系统了,数据库的数据如何和文件系统进行交互,就是这一层要做的事情了。

  • 索引

不得不说,索引绝对是数据库中最经常考察,考点也最多的内容了。

比如给你一条sql,那么它能否命中索引,能命中哪些索引,如果想要命中某个索引,你应该如何修改,这种问题面试时是不是经常看到,变来变去这么多题型,其实面试官就是想考察你对于索引的理解。

还有就是,索引的数据结构,一样是非常热门的考点之一,索引其实是基于B+树来实现的,不知道b+树是啥,请回去看数据结构。

简单来说,它是一种多路搜索树,致力于更短的时间来完成数据检索,因为它的高度比二叉树要低,而比起普通的b树,它的非叶节点只起索引作用,而叶子节点是顺序串联的,所以非常适合做搜索树。

如果你理解了这一点,那么面对此类面试题就可以更加从容一些,面试官其实就是想知道你对b+树的了解到了什么样的程度而已。

  • 事务和锁

除了索引之外,数据库中最复杂的内容可能就是事务和锁了。

就拿事务的ACID特性来说,你需要了解每个大写字母背后的实现原理,比如原子性是如何实现的,一致性是如何保证的,背后的原理是什么。

我们平时常用的事务可能就是spring里的事务模板,在事务里执行的同库数据库操作,要么都成功,要么都失败,这就是原子性。

两个事务之间互不影响,这就是隔离性,当然了,这里又涉及到了事务隔离级别。

事务隔离级别包括读未提交,读已提交,可重复读和序列化,每个事务隔离级别都适用于某种数据库读写场景,很多时候,我们都需要搞懂隔离级别背后的原理,才能更好地使用它。

MySQL里默认使用可重复读的隔离级别,这个级别基本上可以保证我们的事务按照预期执行,在MySQL中,这个事务隔离级别甚至可以解决幻读的问题。

在MySQL的事务背后,其实有一个隐藏的boss,那就是数据库的锁,很多事务的隔离级别都是通过锁来实现的,比如可重复读只要加行锁就可以实现了,而幻读则需要加上间隙锁next-key lock来实现。

行级锁和表级锁是MySQL中的两种锁,表级锁顾名思义,会直接锁表,一次只有一个事务能够访问,而行级锁其实锁的也并非是一行,在MySQL中,这个锁加在索引上,而这个索引对应的数据往往不止一行,所以这个行级锁只是理论意义上的"行级锁"

说了这么多,要理解MySQL的事务和锁,还是要多看看相关的书籍和文章,理解其内部的实现原理,知其然也要知其所以然。

MySQL学习教程

这个mysql学习教程是最适合新手学习入门,动力节点的杜老师所讲,杜老师讲课风格雷厉风行,干脆利索。

特点:

  • 适合绝对零基础的学者;

  • 采用循序渐进的方式教学,所以不存在听不懂,学不会;

  • 看完之后完全可以担当日常开发工作;

总的来说,视频是站在绝对零基础的角度来教,主要内容包括:DQL、DML、DDL、DCL、TCL等SQL语句的学习,尤其对DQL语句进行了详细的讲解,包括单表查询、多表联查、内连接、外连接等。另外还讲授了数据库事务的处理,数据库索引的实现原理,视图的使用等内容。

通过本mysql教程的学习可以让一个小白从不会数据库到能够在编程中熟练使用数据库。

MySQL学习资料下载:http://www.bjpowernode.com/?niuke