该文章为知识总结的文章,如果是初学者,建议先从专栏学习:数据库专栏

一、Mysql 的架构图

  • 客户端:比如window和linux的黑窗口、SQLlyog、java的JDBC标准等等
  • Server 层:主要包括连接器、查询缓存、分析器、优化器、执行器等,所有跨存储引擎的功能都在这一层实现,比如存储过程、触发器、视图,函数等,还有一个通用的日志模块 binglog 日志模块。
  • 存储引擎:主要负责数据的存储和读取,采用可以替换的插件式架构,支持 InnoDB、 MyISAM、 Memory 等多个存储引擎,其中 InnoDB 引擎有自有的日志模块 redolog 模块。 现在最常用的存储引擎是 InnoDB,它从MySQL 5.5.5 版本开始就被当做默认存储引擎了。
  • 数据:都是二进制文件

二、Server 层

1. 连接器

  • 连接器主要和身份认证和权限相关的功能相关

  • 客户端通过连接器连接到MySql

  • 客户端连接连接器是需要网络时间,所以建议使用数据库连接池,可以复用连接

2. 查询缓存

  • 查询缓存主要用来缓存我们所执行的 SELECT 语句以及该语句的结果集。
  • 连接建立后,执行查询语句的时候,会先查询缓存, MySQL 会先校验这个 sql 是否执行过,以 Key-Value 的形式缓存在内存中
  • 如果缓存 key 被命中,就会直接返回给客户端,如果没有命中,就会执行后续的操作,完成后也会把
    结果缓存起来,方便下一次调用
  • MySQL 查询不建议使用缓存,因为查询缓存失效在实际业务场景中可能会非常频繁,假如你对一个表更新的话,这个表上的所有的查询缓存都会被清空,MySQL 8.0 版本后删除了缓存的功能
  • 缓存虽然能够提升数据库的查询性能,但是缓存同时也带来了额外的开销,每次查询后都要做一次缓存操作,失效后还要销毁。

存在的问题

  • 查询缓存的内存分配问题,不可避免地产生一些内存碎片;

  • 查询缓存对是否是一样的查询语句,要求非常苛刻,而且还不智能

  • 查询缓存中涉及的表,每一个表对象都有一个属于自己的全局性质的锁,表对象的DML操作,必须优先判断是否需要清理相关查询缓存的记录信息,将不可避免地出现锁等待事件

  • 表若是做DDL等类似操作,触发相关表的查询缓存信息清空

3. 分析器

没有命中缓存的话, SQL 语句就会经过分析器,分析器说白了就是要先看你的 SQL 语句要干嘛,再检查你的
SQL 语句语法是否正确。 分析器也会分为几步:

  • 第一步,词法分析,一条 SQL 语句有多个字符串组成,首先要提取关键字,比如 select,提出查询的表,提出字段名,提出查询条件等等。做完这些操作后,就会进入第二步。

  • 第二步,语法分析,主要就是判断你输入的 sql 是否正确,是否符合 MySQL 的语法。

完成这 2 步之后, MySQL 就准备开始执行了,但是如何执行,怎么执行是最好的结果呢?这个时候就需要优化器上场了

4.优化器

优化器的作用就是它认为的最优的执行方案去执行(有时候可能也不是最优),比如多个索引的时候该如何选
择索引,多表查询的时候如何选择关联顺序等。可以说,经过了优化器之后可以说这个语句具体该如何执行就已经
定下来。

5. 执行器

  • 当选择了执行方案后, MySQL 就准备开始执行了,首先执行前会校验该用户有没有权限,如果没有权限,就会返回错误信息,如果有权限,就会去调用引擎的接口, 从存储引擎返回执行的结果。

三、执行流程

  1. 客户端连接连接器
  2. 分析器处理客户端的SQL语句,进行词法分析和语法分析,检查SQL语法是否正确
  3. 优化器优化分析器处理的语句,选择一个它认为的最优的执行方案去执行,比如多个索引的时候该如何选
    择索引,多表查询的时候如何选择关联顺序等
  4. 最后执行器执行优化器确定的方案,但是由于不了解数据是怎么存储的,需要调用存储引擎的接口,从存储引擎返回执行的结果
  5. 存储引擎决定怎么存储数据,常见的有三种:InnoDB存储引擎、MyISAM存储引擎和Memory引擎(博主主要掌握的InnoDB存储引擎)
  6. 当然中间还有一个查询缓存,会存储查询出来的数据,但是查询缓存命中不高,MySQL 查询不建议使用缓存,因为查询缓存失效在实际业务场景中可能会非常频繁,假如你对一个表更新的话,这个表上的所有的查询缓存都会被清空,MySQL 8.0 版本后删除了缓存的功能,