一生挚友redo log、binlog《死磕MySQL系列二》

原来是咔咔 2023-03-28 原文

一生挚友redo log、binlog

前言

上期根据一条查询语句查询流程分析MySQL的整体架构。同样，本期也使用一条查询SQL语句来做引子。可以肯定的是，查询语句执行的流程更新语句同样也会执行。

因此本期的着重点就不在MySQL架构图上，文章标题也给出了大家重点，就是要了解redo log、binlog。

一、redo log第一步，创建一个表 user，主键是 id，下面是创建语句。

CREATE TABLE `user` (
 `id` int(11) NOT NULL AUTO_INCREMENT,
 `name` varchar(255) NOT NULL,
 `age` tinyint(4) NOT NULL,
 `time` int(11) NOT NULL,
 PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4

插入一条数据

insert into user (`name`,`age`,`time`) values ("咔咔","25",unix_timestamp(now()))

若要将插入的这条数据的age改为26，则需要执行语句

update user set age = 26 where id = 1;

第一期文章中提到一条查询语句的执行流程，该流程与更新语句相同。这里将那幅图拿过来在熟悉一下。

每个模块的功能可以回到第一期文章去查看。

在MySQL8.0中redo log、binlog日志文件都位于/var/lib/mysql此目录下，如图

文件名为ib_logfile的是重做日志，undo开头的就是回滚日志，对于回滚日志后期进行详细的讨论。

redo log（重做日志）是实现事务持久性必备要素，当一个事务提交后，并非直接修改数据库的数据，而是首先保证在 redo log中记录相关的操作。

Innodb存储引擎中的redo log大小是固的，上图显示配置了一组两个文件，每个文件大小默认为48M，使用innodb_log_file_size参数来控制单个文件大小，在MySQL5.6.8以及之后版本都默认为48M。

然后redo log可以记录48M的操作，redo log是一个闭环的循环写。所设定的文件个数和文件大小不再增加。

write pos将记录当前位置，同时向后移动，在ib-log-file-3文件末尾后，然后返回ib-logfilg-0文件开始写。

check point记录的是当前擦除的位置，要使文件循环写入，必须一边擦除。清楚数据的前提是要将记录更新到数据文件。

上面的绿色部分就是可写的部分，假设如果 writepos追上了 checkpoint，那该怎么办？

你必须理解write pos的推进是因为在执行更新操作，这样就不能再执行更新操作，直到记录更新到数据文件，然后check point进行擦除后才可以继续执行更新操作。

对于innodb_log_file_size的设置也是有一些计算规则的，下面将为你介绍。

若innodb_log_file_size设置太小，将导致redo log文件频繁切换，频繁的触发数据库的检查点（check point），导致记录更新到数据文件的次数增加，从而影响IO性能。

同样，如果有一个大的事务，并且所有 redo log日志都已写满，但是还没有完成，将导致日志无法切换，从而导致 MySQL直接堵死。

innodb_log_file_size设置太大，虽然极大地提高了 IO性能，但是在 MySQL重启或宕机时，恢复时间会因为 redo log文件过大而延长。而这种恢复时间通常是无法控制的。

在设置合理的redo log大小和数量后，Innodb能够保证，即使数据库发生异常重启，以前提交的记录也不会丢失，这一点也称为crash-safe。

在这里，对crash-safe的理解先不提及它是什么，后面的文章会让你明白。

二、如何根据项目情况设置innodb_log_file_size对于参数innodb_log_files_in_group设置3~4个就够用了，不用进行优化。

着重讨论innodb_log_file_size的大小设置或优化设置。

在 MySQL8.0之前，通常是计算在一段时间内生成的事务日志(redo log)大小，而 MySQL日志文件最小应承载一小时的业务日志量。

此处的一段时间必须视自己的业务情况而定，外界有用1分钟的日志量也有1小时的日志量来计算。

首先看一下 MySQL客户端的一个命令 pager，在 MySQL日常操作中，通过设置 pager的显示方式，可以大大提高工作效率。

目前，要查看 sequence在一分钟之内的值，您就可以执行 pager grep sequence，它对mysql> show engine innodb status\ G select sleep (60); show engine innodbstatus\ G;返回的结果。

禁止 pager设置执行 nopager，如果不执行该命令，则只有等到下一次重新启动该命令才会失效。

此处咔咔是在虚拟机上做的操作，可以看到一分钟内是没有任何操作，所以值前后相同，你可以在测试服务器做测试。

这样计算出来的select (后边数据-前面的数据)/1024/1024*60 asMB_per_hour;值是一个小时后 redo log的大小

但是用这种方法计算一定是不合适的，在一分钟内业务繁忙或者业务空闲时间计算出的值都会产生较大误差。

合适的方法是在一天中确定几个时间点，用一个脚本定时执行，然后记录相应的值，再取平均值，计算出的误差将减至最小。

什么是 sequece?

当每个 binlog生成时，该值从1开始，然后递增，每增加一个事务， sequenumber就加上1。

二、binlog您可以从总体上了解到 MySQL架构分为两层，一个是 server层，另一个是存储引擎层。

server层当然是负责功能方面的，而存储引擎层则负责处理与存储相关的操作。

而且上面提到的redo log是Innodb存储引擎层特有的，其它存储引擎是不具备的，而server层也有自己的日志记录，就是将要聊到的binlog。

redo log和binlog的区别

redo log是Innodb引擎特有的，而binlog是MySQLserver层特有的，所有引擎都可以使用。

redo log是物理日志，它记录的是一条更新操作所做的修改，binlog是逻辑日志，记录的是一条更新语句执行逻辑

redo log是循环写的，并且空间是固定的，比如上面配置4个1GB的redo log文件，binlog是追加写的，这个文件写完了，换下一个文件，不会覆盖以前的日志。这也就是你经常看到只要你有完整的binlog文件就可以给你恢复到你想要的数据。

MySQL为什么会有俩份日志呢？

在没有Innodb存储引擎之前，MySQL默认存储引擎是MyIsam，但MyIsam是没有重启恢复能力的，binlog日志也仅用于归档。

Innodb是另一家公司以插件的形式引入到Mysql，既然binlog没有重启恢复的能力，那么我就使用redo log来实现重启恢复的功能。

这就导致了当你使用Innodb存储引擎时会写俩份日志。

三、什么是两阶段提交对redo log、binlog有了一定的认识后再来看看一条更新语句的执行流程。

update user set age = age + 1 where id = 1;

执行器先到引擎层找到id = 1这一行，由于ID是主键，所以会在主键索引树找到这一行。如果ID=2这一行所在的数据页本来就在内存中，就直接返回给执行器。否则，需要先从磁盘中读入内存，然后再返回。
执行器拿到存储引擎返回id = 2结果后，给age加上1，原来是25，现在就是26,在调用引擎接口写入这行新数据。
引擎将这行数据先更新到内存中，同时将这个更新操作记录到redo log中，此时redo log处于prepare状态。然后告知执行器执行完成了，随时可以提交事务。
接着执行器生成这个操作的binlog，并把binlog写入磁盘。
执行器调用引擎的提交事务接口，引擎把刚刚写入的redo log改成提交commit状态，更新完成。

到这里你应该就清晰了，一条更新SQL会先写redo log再写binlog，这也就是标题为什么叫一生挚友redo log、binlog。

四、为什么需要两阶段提交是为了让redo log跟binlog两份日志之间的逻辑一致，看下面俩种情况。

先写redo log后写binlog

更新语句为age = age +1
将数据写入redo log，MySQL进程异常重启
此时binlog还没有开始写
系统重启后进行数据恢复此时的值为26
需要搭建从库时需要拿binlog进行恢复数据，但此时age = age +1 这行的操作是没有记录到binlog的
那么此时的从库就会少这一次的更新，恢复出来的age依然是25，造成于主库数据不一致。

先写binlog后写redo log

更新语句为age = age +1
将数据写入binlog，MySQL异常重启
此时redo log 还没写
MySQL系统重启，这个更新操作是对于redo log是不存在的，所以重启后的值依然是25
但binlog 中的值已将是26了
需要搭建从库时，从库的值是26，主库的值是25，造成主从数据不一致

所以说，如果不使用两阶段提交，那么原库和用它的binlog日志恢复出来的库数据是不一致的。

五、《孔乙己》让你明白redo log是什么来看一个初中九年级语文课文中《孔乙己》这篇文章，就算不记得内容，标题总记得哈！

这个案例也是看丁老师文章中提到的，为什么丁老可以灵活的使用这个案例来讲redo log而我们想不到呢？

其本质原因是对知识点没有理解透彻，使用生活案例来解释技术是让人最容易理解并不难遗忘的。

《孔乙己》中的主人公就叫他酒店掌柜，掌柜的有俩件法宝让比其他老板工作效率高很多。一个是小黑板另一个是账本。

试想一下如果有客人要赊账，是直接写到黑板效率高，还是翻密密麻麻的账本来的快呢？

掌柜肯定会选择先记录到黑板上，等人少或者不忙时再把黑板的记录写到账本中。

反之老板没有黑板的话，只能在密密麻麻的账本中先找到赊账人的名字，如果之前有赊账记录追加，找了一遍发现没有才进行新增。

这个过程不仅繁琐而且效率低的让人难以接受，如果酒店客人多老板是记录不过来的。

同样，在MySQL中也会存在这个问题，每次执行更新语句都需要先找到那条记录，然后再更新，整个过程IO成本、查找成本都很高。所以MySQL也利用了酒店掌柜的智慧使用黑板来提升执行效率。

画一幅图让大家能更好的理解掌柜、黑板、在MySQL中的对应关系。

六、redo log参数详解事务的持久性就是通过重做日志来实现的。

当提交事务之后，并不是直接修改数据库的数据的，而是先保证将相关的操作记录到redo日志中。

数据库会根据相应的机制将内存的中的脏页数据刷新到磁盘中。

上图是一个简单的重做日志写入流程。

在上图中提到俩个陌生概念，Buffer pool、redo log buffer，这个俩个都是Innodb存储引擎的内存区域的一部分。

而redo log file是位于磁盘位置。

也就说当有DML（insert、update、delete）操作时，数据会先写入Buffer pool，然后在写到重做日志缓冲区。

重做日志缓冲区会根据刷盘机制来进行写入重做日志中。

这个机制的设置参数为innodb_flush_log_at_trx_commit，参数分别为0,1，2

上图即为重做日志的写入策略。

当这个参数的值为0的时，提交事务之后，会把数据存放到redo log buffer中，然后每秒将数据写进磁盘文件
当这个参数的值为1的时，提交事务之后，就必须把redo log buffer从内存刷入到磁盘文件里去，只要事务提交成功，那么redo log就必然在磁盘里了。
当这个参数的值为2的情况，提交事务之后，把redo log buffer日志写入磁盘文件对应的os cache缓存里去，而不是直接进入磁盘文件，1秒后才会把os cache里的数据写入到磁盘文件里去。

服务器异常停止对事务如何应对（事务写入过程）

当参数为0时，前一秒的日志都保存在日志缓冲区，也就是内存上，如果机器宕掉，可能丢失1秒的事务数据。
当参数为1时，数据库对IO的要求就非常高了，如果底层的硬件提供的IOPS比较差，那么MySQL数据库的并发很快就会由于硬件IO的问题而无法提升。
当参数为2时，数据是直接写进了os cache缓存，这部分属于操作系统部分，如果操作系统部分损坏或者断电的情况会丢失1秒内的事务数据，这种策略相对于第一种就安全了很多，并且对IO要求也没有那么高。

小结

关于性能：0>2>1

关于安全：1>2>0

根据以上结论，所以说在MySQL数据库中，刷盘策略默认值为1，保证事务提交之后，数据绝对不会丢失。

坚持学习、坚持写作、坚持分享是咔咔从业以来所秉持的信念。愿文章在偌大的互联网上能给你带来一点帮助，我是咔咔，下期见。

挚友 binlog redo log mysql 数据库 sql 原力计划数据MySQL

有关一生挚友redo log、binlog《死磕MySQL系列二》的更多相关文章

python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声？ - 2
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题？更新问题，以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点？我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等)，但我确实想创建一个输出文件。
ruby-on-rails - 使用一系列等级计算字母等级 - 2
这里是Ruby新手。完成一些练习后碰壁了。练习:计算一系列成绩的字母等级创建一个方法get_grade来接受测试分数数组。数组中的每个分数应介于0和100之间，其中100是最大分数。计算平均分并将字母等级作为字符串返回，即“A”、“B”、“C”、“D”、“E”或“F”。我一直返回错误:avg.rb:1:syntaxerror,unexpectedtLBRACK,expecting')'defget_grade([100,90,80])^avg.rb:1:syntaxerror,unexpected')',expecting$end这是我目前所拥有的。我想坚持使用下面的方法或.join，
【鸿蒙应用开发系列】- 获取系统设备信息以及版本API兼容调用方式 - 2
在应用开发中，有时候我们需要获取系统的设备信息，用于数据上报和行为分析。那在鸿蒙系统中，我们应该怎么去获取设备的系统信息呢，比如说获取手机的系统版本号、手机的制造商、手机型号等数据。1、获取方式这里分为两种情况，一种是设备信息的获取，一种是系统信息的获取。1.1、获取设备信息获取设备信息，鸿蒙的SDK包为我们提供了DeviceInfo类，通过该类的一些静态方法，可以获取设备信息，DeviceInfo类的包路径为：ohos.system.DeviceInfo.具体的方法如下：ModifierandTypeMethodDescriptionstatic StringgetAbiList()Obt
使用canal同步MySQL数据到ES - 2
文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目，Java开发。基于数据库增量日志解析，提供增量数据订阅&消费。Git地址：https://github.co
阿里云RDS——产品系列概述 - 2
基础版云数据库RDS的产品系列包括基础版、高可用版、集群版、三节点企业版，本文介绍基础版实例的相关信息。RDS基础版实例也称为单机版实例，只有单个数据库节点，计算与存储分离，性价比超高。说明RDS基础版实例只有一个数据库节点，没有备节点作为热备份，因此当该节点意外宕机或者执行重启实例、变更配置、版本升级等任务时，会出现较长时间的不可用。如果业务对数据库的可用性要求较高，不建议使用基础版实例，可选择其他系列（如高可用版），部分基础版实例也支持升级为高可用版。基础版与高可用版的对比拓扑图如下所示。优势性能由于不提供备节点，主节点不会因为实时的数据库复制而产生额外的性能开销，因此基础版的性能相对于
ruby-on-rails - 无法安装 mysql2 0.3.14 gem - 2
我看到其他人也遇到过类似的问题，但没有一个解决方案对我有用。0.3.14gem与其他gem文件一起存在。我已经完全按照此处指示完成了所有操作:https://github.com/brianmario/mysql2.我仍然得到以下信息。我不知道为什么安装程序指示它找不到include目录，因为我已经检查过它存在。thread.h文件存在，但不在ruby目录中。相反，它在这里:C:\RailsInstaller\DevKit\lib\perl5\5.8\msys\CORE\我正在运行Windows7并尝试在Aptana3中构建我的Rails项目。我的Ruby是1.9.3。$gemin
ruby - 如何使用 ruby mysql2 执行事务 - 2
我已经开始使用mysql2gem。我试图弄清楚一些基本的事情——其中之一是如何明确地执行事务(对于批处理操作，比如多个INSERT/UPDATE查询)。在旧的ruby-mysql中，这是我的方法:client=Mysql.real_connect(...)inserts=["INSERTINTO...","UPDATE..WHEREid=..",#etc]client.autocommit(false)inserts.eachdo|ins|beginclient.query(ins)rescue#handleerrorsorabortentirelyendendclient.commi
ruby - 从结束值创建一系列字符串 - 2
我使用irb。下面是我写的代码。“斧头”..“bc”我期待"ax""ay""az""ba"bb""bc"但结果只是“斧头”..“bc”我该如何纠正？谢谢。最佳答案 >puts("ax".."bc").to_aaxayazbabbbc 关于ruby-从结束值创建一系列字符串，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/7617092/
ruby-on-rails - 用一系列时间增量填充选择，加上其他选项 - 2
使用RubyonRails，我使用给定的增量(例如每30分钟)用时间填充“选择”。目前我正在YAML文件中写出所有的可能性，但我觉得有一种更巧妙的方法。我想我想提供一个开始时间、一个结束时间、一个增量，并且目前只提供一个名为“关闭”的选项(想想“business_hours”)。所以，我的选择可能会显示:'Closed'5:00am5:30am6:00am...[allthewayto]...11:30pm谁能想出更好的方法，或者只是将它们全部“拼写”出来的最佳方法？最佳答案此答案基于@emh的答案。defcreate_hour
ruby-on-rails - 当我通过 rvm 使用 rails3 时，如何在 ubuntu 上安装 mysql2 gem？ - 2
我正在尝试绕过rails配置这个极其复杂的迷宫。到目前为止，我设法在ubuntu上设置了rvm(出于某种原因，ruby在ubuntu存储库中已经过时了)。我设法建立了一个Rails项目。我希望我的测试项目使用mysql而不是mysqlite。当我尝试“rakedb:migrate”时，出现错误:“!!!缺少mysql2gem。将其添加到您的Gemfile:gem'mysql2'”当我尝试“geminstallmysql”时，出现错误，告诉我需要为安装命令提供参数。但是，参数列表很大，我不知道该选择哪些。如何通过在ubuntu上运行的rvm和mysql获取rails3？谢谢。

一生挚友redo log、binlog《死磕MySQL系列 二》