深入分析Redis内存碎片

程序员旭阳 2023-03-28 原文

前言

我们先来看一个问题, 假设Redis实例保存了5GB的数据，现在删除了2GB的数据，那么Redis进程占用的内存会不会减少呢？

答案是：它可能仍然占用大约5GB内存，即使Redis数据只占用大约3GB。

如果maxmemory不设置该参数，Redis不会触发内存淘汰策略删除数据。

Redis会继续为新写入的数据分配内存。分配失败会导致应用程序报错，当然不会导致宕机。

注：设置maxmemory参数，执行命令CONFIG SET maxmemory 100mb，或在redis.conf 配置文件中设置maxmemory 100mb。

使用top命令查看数据是否已经删除，为什么它仍然占用这么多内存？

释放的内存去了哪里？

当我们使用top命令查看系统使用情况时，会发现内存依然很高，Redis并没有真正释放内存。那么内存都去哪儿了？这时候我们就需要使用info memory命令获取Redis内存相关的指标。

127.0.0.1:6379> info memory
# Memory
used_memory:1132832           // Redis Amount of memory used to store data
used_memory_human:1.08M       // Returns the total amount of memory in human readable form
used_memory_rss:2977792       // From the perspective of the operating system, the total physical memory occupied by the process
used_memory_rss_human:2.84M   // used_memory_rss Readability mode display
used_memory_peak:1183808      // The maximum value of memory used, representing the peak value of used_memory

used_memory_peak_human:1.13M  // Returns the value of used_memory_peak in a human readable format
used_memory_lua:37888         // Lua The amount of memory consumed by the engine。
used_memory_lua_human:37.00K
maxmemory:2147483648          // The maximum memory value that can be used, in bytes.
maxmemory_human:2.00G         // readable form
maxmemory_policy:noeviction   // Memory Retirement Policy

mem_fragmentation_ratio:2.79  // The ratio of used_memory_rss & used_memory represents the memory fragmentation rate

Redis进程内存消耗主要由以下几部分组成：

内存被Redis自己启动占用
存储对象数据内存
缓冲区内存：主要由client-output-buffer-limit客户端输出缓冲区、copy backlog缓冲区、AOF缓冲区组成
内存碎片

Redis自身的空进程占用的内存很小，可以忽略不计，而对象内存是最大的，里面存放了所有的数据。

需要注意, 如果缓冲区有大流量的场景很容易失控，导致Redis内存不稳定。

内存碎片过多导致有可用空间不足，无法存储数据。内存碎片Fragmentation = used_memory_rss 实际使用的物理内存（RSS 值）除以 used_memory 实际存储的数据内存。

什么是内存碎片？

内存碎片会导致内存空间空闲，但无法存储数据。比如你和女朋友去电影院看电影，你们肯定是要在一起的。

假设现在有 8 个座位，已售出 4 张票，还有 4 张可供购买。不过巧合的是，买票的人很奇怪，都是隔一个座位买票。即使还有4个座位，也不能买顺序连接两个座位的票。

什么导致内存碎片？

主要有两个原因：

内存分配器的分配策略
键值对的大小不同，删除操作

下面我们就实际发生的原因进行探讨。

1. 内存分配器的分配策略

Redis 默认的内存分配器使用jemalloc，可选的分配器有：glibc，tcmalloc。

内存分配器不能按需分配，而是使用固定范围的内存块进行分配。

比如8字节、16字节……、2KB、4KB，当申请内存最接近固定值时，jemalloc会分配最接近固定值的空间。这样就会出现内存碎片。

比如程序只需要1.5KB，而内存分配器会分配2KB的空间，那么这0.5KB就是碎片。这样做的目的是减少内存分配的次数。比如你申请22个字节的空间来存放数据，jemalloc就会分配32个字节。如果后面需要写入10个字节，则不需要向操作系统申请空间。您可以使用之前请求的 32 个字节。

当一个键被删除时，Redis 不会立即将内存归还给操作系统。发生这种情况是因为底层内存分配器的管理。例如，大多数已删除的键仍与其他有效键分配在同一内存页中。

此外，为了重用空闲内存块，分配器删除了原始 5 GB 数据中的 2 GB。再次向实例添加数据时，Redis的RSS会保持稳定，不会增加太多。因为内存分配器基本上重新使用了之前删除释放的2GB内存。

2.键值对大小不同，删除操作

由于内存分配器是按照固定的大小分配内存，因此分配的内存空间通常会大于实际数据占用的大小，这会造成碎片，降低内存的存储效率。

另外，键值对的频繁修改和删除导致内存空间的扩大和释放。例如，如果原来占用32个字节的字符串现在修改为占用20个字节的字符串，那么释放的12个字节就是空闲空间。

如果下一次数据存储请求需要申请一个13字节的字符串，刚刚释放的12字节空间就不能使用，造成碎片。

分片最大的问题：空间总量足够大，但是这些内存并不连续，可能存不下数据。

mem_fragmentation_ratio = used_memory_rss/ used_memory

如何解决？

首先要判断是否发生了内存碎片，重点看info memory命令执行后的mem_fragmentation_ratio指标，表示内存碎片率。

如果1 < mem_fragmentation_ratio < 1.5，可以认为是合理的，如果大于1.5，说明碎片已经超过了50%，我们需要采取一些措施来解决碎片过多的问题。

1. 重启

最简单的方法是重新启动。如果未启用持久性，数据将丢失。

如果开启持久化，需要使用RDB或者AOF来恢复数据。如果只有一个实例，数据量大会导致恢复阶段长时间无法提供服务，高可用性会大大降低。

2.自动清理内存碎片

Redis在4.0版本之后，提供了内存碎片清理机制。

对于Redis来说，当连续的内存空间被分割成若干个不连续的空间时，操作系统首先将数据移动拼接在一起，释放掉原来数据占用的空间，形成一个连续的空闲内存空间。

图片由作者提供

自动清理虽然好，但也不要乱来。操作系统需要消耗资源将数据移动到新的位置，然后释放原来的空间。

Redis 操作数据的指令是单线程的，所以在数据复制和移动时，只有清理碎片后才能处理请求，会造成性能损失。

那么问题来了，如何减少对性能的影响来实现自动清理碎片？

问得好，用下面两个参数来控制内存碎片清理和结束的时机，避免占用过多CPU，减少清理碎片对Redis处理请求的性能影响。

启用自动内存碎片整理：

CONFIG SET activedefrag yes

这只是为了启用自动清洁。当清理需要同时满足以下两个条件时，就会出发清理操作。

清理条件

active-defrag-ignore-bytes 200mb：内存碎片占用内存达到200MB，开始清理；

active-defrag-threshold-lower 20: 内存碎片空间超过系统分配给Redis空间的20%，开始清理。

避免性能影响

清理时间是有的，需要控制清理对性能的影响。一二设置先分配清理碎片占用的CPU资源，保证碎片可以正常清理，避免对Redis处理请求造成性能影响。

active-defrag-cycle-min 20：自动碎片整理过程中占用CPU时间比例不低于20%，以保证清理任务正常进行。

active-defrag-cycle-max 50：自动清理进程占用CPU时间比例不能高于50%。如果超过，会立即停止清理，避免阻塞 Redis 造成高延迟。

总结

如果发现Redis存储数据占用的内存比操作系统分配给Redis的内存小很多，但是数据无法保存，那么可能是内存碎片很多。使用info memory命令查看内存碎片mem_fragmentation_ratio指标是否正常。

然后我们启用自动清理并合理设置清理时间和CPU资源占用。该机制涉及内存复制，这对 Redis 性能构成潜在风险。如果Redis性能变慢，检查是否是清理碎片导致的。如果是这样，减小配置active-defrag-cycle-max的值。

深入 Redis span style color 数据库 $Redis 内存碎片

有关深入分析Redis内存碎片的更多相关文章

ruby-on-rails - Ruby net/ldap 模块中的内存泄漏 - 2
作为我的Rails应用程序的一部分，我编写了一个小导入程序，它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是，与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存，我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关，因为当我删除对LDAP内容的调用时，内存使用情况会很好地稳定下来。此外，不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray，它们都是LDAP库的一部分。当我运行导入时，内存使用量最终达到超过1GB的峰值。如果问题存在，我需要找到一些方法来更正我的代
ruby-on-rails - Ruby 中的内存模型 - 2
ruby如何管理内存。例如:如果我们在执行过程中采用C程序，则以下是内存模型。类似于这个ruby如何处理内存。C:__________________|||stack|||------------------||||------------------|||||Heap|||||__________________|||data|__________________|text|__________________Ruby:? 最佳答案 Ruby中没有“内存”这样的东西。Class#allocate分配一个对象并返回该对象。这就是程序
键删除后 ruby 哈希内存泄漏 - 2
你好，我无法成功如何在散列中删除key后释放内存。当我从哈希中删除键时，内存不会释放，也不会在手动调用GC.start后释放。当从Hash中删除键并且这些对象在某处泄漏时，这是预期的行为还是GC不释放内存？如何在Ruby中删除Hash中的键并在内存中取消分配它？例子:irb(main):001:0>`ps-orss=-p#{Process.pid}`.to_i=>4748irb(main):002:0>a={}=>{}irb(main):003:0>1000000.times{|i|a[i]="test#{i}"}=>1000000irb(main):004:0>`ps-orss=-p
ruby-on-rails - HTTParty 的内存问题和下载大文件 - 2
这会导致Ruby出现内存问题吗？我知道如果大小超过10KB，Open-URI会写入TempFile。但是HTTParty会在写入TempFile之前尝试将整个PDF保存到内存吗？src=Tempfile.new("file.pdf")src.binmodesrc.writeHTTParty.get("large_file.pdf").parsed_response 最佳答案您可以使用Net::HTTP。参见thedocumentation(特别是标题为“流媒体响应机构”的部分)。这是文档中的示例:uri=URI('http://e
建模分析 | 平面2R机器人(二连杆)运动学与动力学建模(附Matlab仿真) - 2
目录0专栏介绍1平面2R机器人概述2运动学建模2.1正运动学模型2.2逆运动学模型2.3机器人运动学仿真3动力学建模3.1计算动能3.2势能计算与动力学方程3.3动力学仿真0专栏介绍?附C++/Python/Matlab全套代码?课程设计、毕业设计、创新竞赛必备！详细介绍全局规划(图搜索、采样法、智能算法等)；局部规划(DWA、APF等)；曲线优化(贝塞尔曲线、B样条曲线等)。?详情：图解自动驾驶中的运动规划(MotionPlanning)，附几十种规划算法1平面2R机器人概述如图1所示为本文的研究本体——平面2R机器人。对参数进行如下定义：机器人广义坐标
网站日志分析软件--让网站日志分析工作变得更简单 - 2
网站的日志分析，是seo优化不可忽视的一门功课，但网站越大，每天产生的日志就越大，大站一天都可以产生几个G的网站日志，如果光靠肉眼去分析，那可能看到猴年马月都看不完，因此借助网站日志分析工具去分析网站日志，那将会使网站日志分析工作变得更简单。下面推荐两款网站日志分析软件。第一款：逆火网站日志分析器逆火网站日志分析器是一款功能全面的网站服务器日志分析软件。通过分析网站的日志文件，不仅能够精准的知道网站的访问量、网站的访问来源，网站的广告点击，访客的地区统计，搜索引擎关键字查询等，还能够一次性分析多个网站的日志文件，让你轻松管理网站。逆火网站日志分析器下载地址：https://pan.baidu.
ABB-IRB-1200运动学分析MATLAB RVC工具分析+Simulink-Adams联合仿真 - 2
一、机器人介绍此处是基于MATLABRVC工具箱，对ABB-IRB-1200型号的微型机械臂进行正逆向运动学分析，并利Simulink工具实现对机械臂进行具有动力学参数的末端轨迹规划仿真，最后根据机械模型设计Simulink-Adams联合仿真。图1.ABBIRB 1200尺寸参数示意图ABBIRB 1200提供的两种型号广泛适用于各作业，且两者间零部件通用，两种型号的工作范围分别为700 mm 和 900 mm，大有效负载分别为 7 kg 和5 kg。 IRB 1200 能够在狭小空间内能发挥其工作范围与性能优势，具有全新的设计、小型化的体积、高效的性能、易于集成、便捷的接
关于Qt程序打包后运行库依赖的常见问题分析及解决方法 - 2
目录一.大致如下常见问题：（1）找不到程序所依赖的Qt库version`Qt_5'notfound(requiredby（2）CouldnotLoadtheQtplatformplugin"xcb"in""eventhoughitwasfound（3）打包到在不同的linux系统下，或者打包到高版本的相同系统下，运行程序时，直接提示段错误即segmentationfault，或者Illegalinstruction(coredumped)非法指令（4）ldd应用程序或者库，查看运行所依赖的库时，直接报段错误二.问题逐个分析，得出解决方法：（1）找不到程序所依赖的Qt库version`Qt_5'
ruby-on-rails - 如何使用 ruby-prof 和 JMeter 分析 Rails - 2
我想使用ruby-prof和JMeter分析Rails应用程序。我对分析特定Controller/操作/或模型方法的建议方法不感兴趣，我想分析完整堆栈，从上到下。所以我运行这样的东西:RAILS_ENV=productionruby-prof-fprof.outscript/server>/dev/null然后我在上面运行我的JMeter测试计划。然而，问题是使用CTRL+C或SIGKILL中断它也会在ruby-prof可以写入任何输出之前杀死它。如何在不中断ruby-prof的情况下停止mongrel服务器？最佳答案
ruby-on-rails - 内存中具有相同 ID 的更多对象？ - 2
在部署在heroku上的Rails应用程序(v:3.1)中，我在内存中获得了更多具有相同ID的对象。我的heroku控制台日志:>>Project.find_all_by_id(92).size=>2>>ActiveRecord::Base.connection.execute('select*fromprojectswhereid=92').to_a.size=>1这怎么可能？可能是什么问题？最佳答案解决方案根据您的SQL查询，您的数据库中显然没有重复条目。也许您的类项目中的size或length方法已被覆盖。我试过find_