草庐IT

Redis 持久化机制

YeeXang 2023-03-28 原文

概述

Redis 官方提供了两种不同的持久化方法来将数据存储到硬盘,分别是:

  • 快照(Snapshot)
  • AOF(Append Only File)只追加日志文件

默认开启快照,同时启用两种持久化方式时,优先 AOF


快照(Snapshot)

这种方式可以将某一时刻的所有数据都写入硬盘,保存的文件以 .rdb 形式结尾的文件,因此也称 RDB 方式

1. 快照生成方式

1.1 客户端方式

Redis 提供了两个命令来生成 RDB 文件,分别是 savebgsave,他们的区别就在于:save 在「主进程」执行,有可能阻塞「主进程」,而 bgsave 会创建一个「子进程」执行

1.2 服务器配置
save 3600 1 300 100 60 10000

上述是 redis.conf 中的相关内容,需要注意的点有两个:

  • 如果配置 save "" 可以完全禁用快照
  • redis 默认开启快照,并且默认配置如下:save 3600 1 300 100 60 10000,它的意思是,只要满足下面条件的任意一个,就会执行 bgsave
    • 3600 秒(1 小时)之内,对数据库进行了至少 1 次修改
    • 300 秒(5 分钟)之内,对数据库进行了至少 100 次修改
    • 60 秒之内,对数据库进行了至少 10000 次修改

如果我们要自定义快照生成频率,只需要按照模板修改就好了

2. 保存快照

# rdb快照文件名
dbfilename dump.rdb
# rdb快照文件存放目录,请确保有写权限
dir ./

3. 其他相关配置

# 默认使用bgsave持久化时,如果发生错误,将停止写RDB快照文件,用户有时很难意识到数据并没有正确的被持久化
# 如果你已经设置了对Redis服务的正确监控,可以考虑关闭该特性,允许忽略错误,继续写RDB快照文件
# yes:开启 no:关闭
stop-writes-on-bgsave-error yes
# 是否使用LZF压缩字符串对象,一般建议开启
# yes:开启 no:关闭
rdbcompression yes
# 在写入和读取RDB文件时是否检查有无损坏
# yes:开启 no:关闭
rdbchecksum yes
# 加载RDB或还原负载时,启用或禁用ziplist和listpack等完全消毒检查
# yes:检查 no:不检查 clients:只对用户连接执行检查
sanitize-dump-payload no
# 在未启用持久性的实例中删除复制使用的RDB文件,默认情况下此选项处于禁用状态
# 此项仅适用于同时禁用AOF和RDB持久性的实例,否则将完全忽略
rdb-del-sync-files no

4. bgsave 执行原理

当接收到 bgsave 命令时,redis 会调用 fork 创建一个子进程,子进程负责将快照写入磁盘,父进程则继续处理命令

父进程可以继续执行命令,也就是数据能被修改,关键在于使用了「写时复制技术」,通过 fork 创建的子进程,和父进程共享同一片内存数据,子进程会复制父进程的页表,但是页表指向的物理内存还是同一个,这是为了加快创建子进程的速度,所以,子进程可以直接读取主进程的内存数据,并写入 RDB 文件

当主进程对共享数据只是只读操作,那么子进程和父进程互不影响,但如果主进程要修改共享数据的某一项,就会发生写时复制,这块数据会被复制一份,然后主进程在该副本进行修改,子进程继续把原来的数据写入 RDB 文件,也就是说,主进程刚修改的数据,是没办法在这一时间写入 RDB 文件的,只能交由下一次的 bgsave 快照

5. 自动触发

除了上述的方式以外,以下情况也会自动生成快照:

  • 主从复制时,从节点从主节点进行全量复制时会触发 bgsave 操作,生成当时的快照发送到从节点
  • 执行 debug reload 命令重新加载 redis 时会触发 bgsave 操作
  • 执行 shutdown 命令时,如果没有开启 aof 持久化,会触发 bgsave 操作

只追加日志文件(Append Only File)

这种方式可以将所有客户端执行的写命令记录到日志文件中,以此记录数据发生的变化。只要 Redis 从头到尾执行一次 AOF 文件所包含的所有写命令,就可以恢复 AOF 文件的记录的数据集

1. 触发 AOF 持久化

redis 默认配置没有开启 AOF 持久化机制,需要在 redis.conf 开启

# yes:开启AOF持久化 no:关闭AOF持久化
appendonly yes
# 指定生成AOF文件名称
appendfilename "appendonly.aof"
# 指定存储AOF文件的文件夹名称
appenddirname "appendonlydir"
# AOF文件的保存位置和RDB文件的位置相同,都是通过dir参数设置
dir ./

从 Redis7 版本开始,使用一组 aof 文件记录数据,分为两种基本类型:

  1. 基本文件,表示文件创建时的完整的数据,可以是 rdb 或 aof 内容格式
  2. 增量文件,记录前一个文件之后的新增命令
  3. 清单文件,追踪文件的创建和使用顺序

文件名是以 appendfilename 前缀,后面跟着序号和类型,因此 aof 文件目录里生成的文件大概有:

  1. 基本文件 appendonly.aof.1.base.rdb
  2. 增量文件 appendonly.aof.1.incr.aof,appendonly.aof.2.incr.aof......
  3. 清单文件 appendonly.aof.manifest

2. 写回策略

Redis 是先执行写操作命令,再将该命令记录到 AOF 日志,只有写操作命令执行成功,才会进行记录,这两个操作都在主线程进行,都会占用磁盘 I/O,因此 AOF 日志写回磁盘的时机很重要

写回策略分为三种:

  • always(谨慎使用):每条 Redis 操作命令都会写入磁盘,最多丢失一条数据
  • everysec(默认):每秒钟写入一次磁盘,最多丢失一秒的数据
  • no(不推荐):由操作系统决定何时写入磁盘,Linux 默认 30s 写入一次数据至磁盘

配置项如下:

appendfsync everysec

至于这三种策略是如何实现的,其实只是在控制 fsync() 函数的调用时机

当应用程序向文件写入数据时,内核通常先将数据复制到内核缓冲区中,然后排入队列,然后由内核决定何时写入硬盘

如果想要应用程序向文件写入数据后,能立马将数据同步到硬盘,就可以调用 fsync() 函数,这样内核就会将内核缓冲区的数据直接写入到硬盘,等到硬盘写操作完成后,该函数才会返回

  • Always 策略就是每次写入 AOF 文件数据后,就执行 fsync() 函数
  • Everysec 策略就会创建一个异步任务来执行 fsync() 函数
  • No 策略就是永不执行 fsync() 函数

3. 重写 AOF 文件

AOF 持久化机制会记录每个写命令,因此 AOF 文件会越来越大,会影响数据恢复的效率。AOF 文件重写会将内存中的数据库内容用命令的方式重写一个新的 aof 文件,替换原有文件,减小 aof 文件体积

3.1 触发重写的方式

第一种方式:客户端执行 BGREWRITEAOF 命令触发重写,不会阻塞 redis 服务

第二种方式:在服务器配置自动触发

auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb

如上配置,启用 AOF 持久化后,当 AOF 文件体积大于 64 M,并且 AOF 文件体积比上次重写之后体积大了至少一倍时,会自动触发重写

指定百分比为 0 可以禁用自动 AOF 重写

auto-aof-rewrite-percentage 0
3.2 重写流程

  1. bgrewriteaof 触发重写,判断是否当前有 bgsave 或 bgrewriteaof 在运行,如果有,则等待该命令结束后再继续执行
  2. 主进程 fork 出子进程执行重写操作,保证主进程不会阻塞
  3. 子进程遍历 redis 内存中数据到临时文件,客户端的写请求同时写入 aof_buf 缓冲区和 aof_rewrite_buf 重写缓冲区,保证原 AOF 文件完整以及新 AOF 文件生成期间的新的数据修改动作不会丢失
  4. 子进程写完新的 AOF 文件后,向主进程发信号,父进程更新统计信息。主进程把 aof_rewrite_buf 中的数据写入到新的 AOF 文件
  5. 使用新的 AOF 文件覆盖旧的 AOF 文件,完成 AOF 重写

4. 其他配置

# 前面讲过,AOF是调用fsync()函数将写操作记录写回磁盘,这会占用一定的磁盘I/O
# 如果设为yes,相当于appendfsync no,不会执行写磁盘操作,只是写入缓冲区,缓解磁盘压力
no-appendfsync-on-rewrite no
# 在Redis启动过程中,当AOF数据重新加载回内存时,可能会发现AOF文件在最后被截断
# 如果设置为yes,则加载一个截断的AOF文件,并通过日志告诉用户该事件
# 如果设置为no,服务器将因错误而中止并拒绝启动,用户需要使用“redis-check-aof”实用程序修复AOF文件
aof-load-truncated yes
# 开启混合持久化,下面会提到
aof-use-rdb-preamble yes
# 支持在aof中记录时间戳,可以在特定时间恢复数据,但会改变aof格式,可能跟已经存在的aof文件不兼容
aof-timestamp-enabled no

RDB 和 AOF 混合方式

Redis4.0 提出了一个混合使用 AOF 日志和内存快照的方法,混合持久化同样也是通过 bgrewriteaof 重写命令完成的,不同的是,当开启混合持久化后,fork 出的子进程先将共享的内存副本全量的以 RDB 方式写入 aof 文件,然后在将重写缓冲区的增量命令以 AOF 方式写入到文件,写入完成后通知主进程更新统计信息,并将新的含有 RDB 格式和 AOF 格式的 AOF 文件替换旧的的 AOF 文件

配置如下:

aof-use-rdb-preamble yes

备份数据

备份 RDB 文件只需将其拷贝到安全的地方,服务器运行时复制 RDB 文件很安全,因为 RDB 文件一旦创建就不会修改了

备份 AOF 在 Redis7.0.0 之前也可直接拷贝,但 7.0.0 版本之后会在 aof 文件夹下有多个文件,在 aof 重写时拷贝可能会得到无法使用的文件,所以在备份时需要关闭 aof 重写,步骤:

  • 关闭自动 aof 重写:CONFIG SET auto-aof-rewrite-percentage 0
  • 确保在此期间没有手动 BGREWRITEAOF 启动重写
  • 检查是否正在重写,查询 INFO persistence,如果返回1,则要等待重写完成
  • 将 aof 文件夹拷贝到安全地方
  • 重新打开自动 aof 重写:CONFIG SET auto-aof-rewrite-percentage <prev-value>

有关Redis 持久化机制的更多相关文章

  1. ruby-on-rails - Rails 模型——非持久类成员或属性? - 2

    对于Rails模型,是否可以/建议让一个类的成员不持久保存到数据库中?我想将用户最后选择的类型存储在session变量中。由于我无法从我的模型中设置session变量,我想将值存储在一个“虚拟”类成员中,该成员只是将值传递回Controller。你能有这样的类(class)成员吗? 最佳答案 将非持久属性添加到Rails模型就像任何其他Ruby类一样:classUser扩展解释:在Ruby中,所有实例变量都是私有(private)的,不需要在赋值前定义。attr_accessor创建一个setter和getter方法:classUs

  2. ruby - Ruby 是否提供响应 OS X 上的 Apple 事件的机制? - 2

    我正在使用Ruby-Tk为OSX开发一个桌面应用程序,我想为该应用程序提供一个AppleEvents接口(interface)。这意味着应用程序将定义它将响应的AppleScript命令的字典(对应于发送到应用程序的Apple事件),并且用户/其他应用程序可以使用AppleScript命令编写Ruby-Tk应用程序的脚本。其他脚本语言支持此类功能——Python通过位于http://appscript.svn.sourceforge.net/viewvc/appscript/py-aemreceive/的py-aemreceive库和Tcl通过位于http://tclae.source

  3. ruby - Ruby 程序的持久哈希表? - 2

    我的Ruby脚本需要一个小型非结构化数据库。不是Sqlite,更像是持久哈希表的东西可以完美地工作,只要它可以存储基本的Ruby结构(数组、字符串、哈希等-都是可序列化的)并且不会在Ruby脚本崩溃时被破坏。我知道有很多类似Perl和Tie::Hash的解决方案,所以可能有一些类似Ruby的gem。那会是什么gem?编辑:据我所知,PStore和yaml解决方案是基于每次更改时读取、解码、重新编码和写入整个数据库。这不仅需要所有这些都适合内存,而且是O(n^2)。所以它们似乎都不是特别好的解决方案。 最佳答案 有PStore在Rub

  4. ruby - Ruby 的方法解除绑定(bind)机制有什么意义? - 2

    Method#unbind返回对该方法的UnboundMethod引用,稍后可以使用UnboundMethod#bind将其绑定(bind)到另一个对象.classFooattr_reader:bazdefinitialize(baz)@baz=bazendendclassBardefinitialize(baz)@baz=bazendendf=Foo.new(:test1)g=Foo.new(:test2)h=Bar.new(:test3)f.method(:baz).unbind.bind(g).call#=>:test2f.method(:baz).unbind.bind(h).

  5. ruby - `save` 和 `save!` 是唯一持久化 ActiveRecord 对象的方法吗? - 2

    我正在尝试调试一些代码。一个奇怪的部分是before_save回调被调用了两次,尽管我只打算保存对象一次。为了追踪这是如何发生的,我在类中定义了这些方法:%w[savesave!].eachdo|method_name|define_method(method_name)do|*args|puts"whocalled'#{method_name}'?#{caller.first}"super(*args)endend从这个输出中,我只看到一个持久化调用。我相信save和save!是导致ActiveRecord持久化对象的唯一方法。据我所知,其他持久化方法依赖于这两者之一;例如,upda

  6. ruby - 具有持久变量的 Sinatra - 2

    我的sinatra应用程序必须解析一个~60MB的XML文件。这个文件几乎从不改变:在每晚的cron作业中,它被另一个覆盖。是否有技巧或方法可以将已解析的文件作为变量保存在内存中,以便我可以在传入请求时从中读取,而不必为每个传入请求一遍又一遍地解析它?一些伪代码来说明我的问题。get'/projects/:id'return@nokigiri_object.search("//projects/project[@id=#{params[:id]}]/name/text()")endpost'/projects/update'ifparams[:token]=="s3cr3t"@noko

  7. ruby-on-rails - 在 state_machine gem 上持久化之前的验证 - 2

    在state_machine中的转换之前执行验证的正确语法是什么?gem?我试过以下,before_transition:apple=>:orangedovalidate:validate_coreenddefvalidate_coreifcore.things.blank?errors.add(:core,'musthaveonething')endend但是我得到以下错误,undefinedmethod`validate'for#我也试过把它写成,state:orangedovalidate:validate_coreend但这会导致记录保存后回滚,不太理想。我想首先阻止状态机转换

  8. ruby - 有没有办法使 Ruby 临时文件永久化? - 2

    如果我通过Tempfile创建了一个临时文件,除了将它复制到另一个文件之外还有什么方法可以使它成为“永久”文件吗?我想避免在关联的Tempfile实例被垃圾回收或进程终止时删除它。与此相关,有没有一种方法可以利用Tempfile机制(或使用类似的机制)来获取"new"文件名,而无需以该名称创建文件? 最佳答案 不是真的。对于问题本身,请参见:ObjectSpace.undefine_finalizer(tmpfile)Tempfile库使用RubyObjectSpace终结器在垃圾回收时自动删除自身。通过使用上面的行,如果你不删除它

  9. Selenium等待机制之显示等待 - 2

    显示等待需要用到两个类:WebDriverWait和expected_conditions两个类WebDriverWait:指定轮询间隔、超时时间等expected_conditions:指定了很多条件函数(也可以自定义条件函数)具体可以参考官网:selenium.webdriver.support.expected_conditions—Selenium4.5documentationfromseleniumimportwebdriverfromselenium.webdriver.common.byimportByfromselenium.webdriver.support.uiimpor

  10. ruby - 不支持您提供的授权机制。请使用 AWS4-HMAC-SHA256 - 2

    我收到错误AWS::S3::Errors::InvalidRequest不支持您提供的授权机制。请使用AWS4-HMAC-SHA256.当我尝试将文件上传到新法兰克福地区的S3存储桶时。所有适用于USStandard区域。脚本:backup_file='/media/db-backup_for_dev/2014-10-23_02-00-07/slave_dump.sql.gz's3=AWS::S3.new(access_key_id:AMAZONS3['access_key_id'],secret_access_key:AMAZONS3['secret_access_key'])s3_

随机推荐