MVCC的介绍
MVCC的好处
读不加锁,读写不冲突。读写不冲突时非常重要的,可以增加系统的并发性能。
MVCC有两种读操作:
- 快照读:也叫一致性读、该事务启动时根据某个条件读取到的数据,直到事务结束时,再次执行相同条件,还是读到同一份数据,不会发生变化。查询语句默认就是快照读
- 当前读:加锁、读取最新的数据。
快照读
快照是如何实现的?
- 事务开始的时候向InnoDB的事务系统申请事务ID,叫做transaction_id。每个事务都有一个唯一的事务ID。
- 当每次事务更新数据的时候,都会生成一个新的数据版本,并且把transaction_id赋值给这个数据版本的事务ID,记作row_trx_id。
例如:
图中表示的是同一行数据的4个版本。
当前最新版本是V4,k值是22,它是被transaction_id = 25的事务更新的,所以row trx_id也是25。这个也解释了上面两行文字的意思。
- 图中的三个虚线箭头就是undo log,而v1、v2、v3并不是物理上真实存在的,而每次需要的时候根据当前版本和undo log计算出来的
- undo log里面记录了更新时数据的版本,所以支持回滚保证原子性。
- 数据库实际上存储的是最新版本的数据。但是对于事务来说,需要根据版本号+undo log日志计算出该事务对应的数据。
当前事务的一致性视图?
视图数组和高水位组成了当前事务的一致性视图。
- 视图数组:InnoDB为每个无数构造了一个数组,用来保存这个事务启动瞬间,当前正在活跃的所有事务ID,活跃指的是启动了但是还没有提交。数组里的事务ID的最小值记为低水位
- 高水位:当前系统里面已经创建过的事务ID的最大值加1记为高水位。
如何判断数据版本的可见性?
- 如果当前是数据版本的row trx_id小于低水位,证明该版本是已经提交的事务或者当前事务自己生成的,数据可见
- 如果当前数据版本在低水位和高水位之间:
若row trx_id在数组中,表示这个版本是由还没有提交的事务生成的,不可见。
若row trx_id不在数组中,说明这个版本是已经提交的事务生成的,可见。
- 如果当前数据版本高于高水位,说明该版本是已经提交了的事务生成的,不可见。
总结:
当事务启动的时候会创建一个视图read-view,这个一致性视图由视图数组(事务启动瞬间保存当前启动未提交的所有事务ID)和高水位(当前系统里面创建过的事务ID的最大值加1)组成。当访问某一行数据的时候,根据当前数据版本的row trx_id(事务开始的时候会被分配一个transaction_id,当事务更新的时候会把transaction_id赋给row trx_id)与该事务的一致性视图里面的低水位、高水位的关系,判断当前数据版本的可见性。如果不可见通过当前版本和undo log计算出旧的数据版本(row trx_id)再次判断是否可见。
例如:
当某事务启动时,低水位为10、高水位为15。视图数组为[10, 11, 14]。当访问的当前数据的版本row trx_id为11,在视图数组中说明这个版本是由没有提交的事务生成,不可见。就会根据当前版本和undo log计算出旧的数据版本row trx_id假如为9,根据版本的可见性说明可见。读取的也就是row trx_id的数据版本。
当某事务启动时,申请到的transaction_id是100。而访问的当前数据的版本row trx_id也是100,说明此数据是当前事务更新的,直接使用即可。
当前读
概念:
更新数据的时候,都是先读后写,这个读,只能读当前的值(也就是最新的数据版本),叫做当前读。
场景:
- 更新数据的时候(update、delete、insert语句)
- select查询语句加锁的时候。(for update、lock in share mode)
如何实现的当前读?
依靠行锁的两阶段锁协议,当前读必须要读取最新的数据,如果读取的行数据有事务未提交,则需要等待事务提交释放行锁,才能执行当前读。
总结:
- 一致性读,也叫快照读依赖MVCC的快照,利用一致性视图、当前的事务ID、当前数据的row trx_id、以及undo log实现。
- 当前读,通过行锁实现。需要等待占有该行事务的提交才能继续进行当前读。
补充
多版本的控制管理器、就是对每一行的数据都有多个版本、同时也相当于对行锁的优化、使读写不发生冲突。通过readView(快照)实现,同时也保证了数据的一致性、防止幻读。