该文章为知识总结的文章,如果是初学者,建议先从专栏学习:数据库专栏
一、Mysql 的架构图
- 客户端:比如window和linux的黑窗口、SQLlyog、java的JDBC标准等等
- Server 层:主要包括连接器、查询缓存、分析器、优化器、执行器等,所有跨存储引擎的功能都在这一层实现,比如存储过程、触发器、视图,函数等,还有一个通用的日志模块 binglog 日志模块。
- 存储引擎:主要负责数据的存储和读取,采用可以替换的插件式架构,支持 InnoDB、 MyISAM、 Memory 等多个存储引擎,其中 InnoDB 引擎有自有的日志模块 redolog 模块。 现在最常用的存储引擎是 InnoDB,它从MySQL 5.5.5 版本开始就被当做默认存储引擎了。
- 数据:都是二进制文件
二、Server 层
1. 连接器
-
连接器主要和身份认证和权限相关的功能相关
-
客户端通过连接器连接到MySql
-
客户端连接连接器是需要网络时间,所以建议使用数据库连接池,可以复用连接
2. 查询缓存
- 查询缓存主要用来缓存我们所执行的 SELECT 语句以及该语句的结果集。
- 连接建立后,执行查询语句的时候,会先查询缓存, MySQL 会先校验这个 sql 是否执行过,以 Key-Value 的形式缓存在内存中
- 如果缓存 key 被命中,就会直接返回给客户端,如果没有命中,就会执行后续的操作,完成后也会把
结果缓存起来,方便下一次调用 - MySQL 查询不建议使用缓存,因为查询缓存失效在实际业务场景中可能会非常频繁,假如你对一个表更新的话,这个表上的所有的查询缓存都会被清空,MySQL 8.0 版本后删除了缓存的功能
- 缓存虽然能够提升数据库的查询性能,但是缓存同时也带来了额外的开销,每次查询后都要做一次缓存操作,失效后还要销毁。
存在的问题
-
查询缓存的内存分配问题,不可避免地产生一些内存碎片;
-
查询缓存对是否是一样的查询语句,要求非常苛刻,而且还不智能
-
查询缓存中涉及的表,每一个表对象都有一个属于自己的全局性质的锁,表对象的DML操作,必须优先判断是否需要清理相关查询缓存的记录信息,将不可避免地出现锁等待事件
-
表若是做DDL等类似操作,触发相关表的查询缓存信息清空
3. 分析器
没有命中缓存的话, SQL 语句就会经过分析器,分析器说白了就是要先看你的 SQL 语句要干嘛,再检查你的
SQL 语句语法是否正确。 分析器也会分为几步:
-
第一步,词法分析,一条 SQL 语句有多个字符串组成,首先要提取关键字,比如 select,提出查询的表,提出字段名,提出查询条件等等。做完这些操作后,就会进入第二步。
-
第二步,语法分析,主要就是判断你输入的 sql 是否正确,是否符合 MySQL 的语法。
完成这 2 步之后, MySQL 就准备开始执行了,但是如何执行,怎么执行是最好的结果呢?这个时候就需要优化器上场了
4.优化器
优化器的作用就是它认为的最优的执行方案去执行(有时候可能也不是最优),比如多个索引的时候该如何选
择索引,多表查询的时候如何选择关联顺序等。可以说,经过了优化器之后可以说这个语句具体该如何执行就已经
定下来。
5. 执行器
- 当选择了执行方案后, MySQL 就准备开始执行了,首先执行前会校验该用户有没有权限,如果没有权限,就会返回错误信息,如果有权限,就会去调用引擎的接口, 从存储引擎返回执行的结果。
三、执行流程
- 客户端连接连接器
- 分析器处理客户端的SQL语句,进行词法分析和语法分析,检查SQL语法是否正确
- 优化器优化分析器处理的语句,选择一个它认为的最优的执行方案去执行,比如多个索引的时候该如何选
择索引,多表查询的时候如何选择关联顺序等 - 最后执行器执行优化器确定的方案,但是由于不了解数据是怎么存储的,需要调用存储引擎的接口,从存储引擎返回执行的结果
- 存储引擎决定怎么存储数据,常见的有三种:InnoDB存储引擎、MyISAM存储引擎和Memory引擎(博主主要掌握的InnoDB存储引擎)
- 当然中间还有一个查询缓存,会存储查询出来的数据,但是查询缓存命中不高,MySQL 查询不建议使用缓存,因为查询缓存失效在实际业务场景中可能会非常频繁,假如你对一个表更新的话,这个表上的所有的查询缓存都会被清空,MySQL 8.0 版本后删除了缓存的功能,