13张图让你百分百掌握kafka副本同步限流机制

石臻臻的杂货铺 2023-11-21 原文

🔥《Kafka运维管控平台》🔥 ✏️更强大的管控能力✏️ 🎾更高效的问题定位能力🎾 🌅更便捷的集群运维能力🌅 🎼更专业的资源治理🎼 🌞更友好的运维生态🌞

文章目录

大家好,我是石臻臻

上周我们分别讲解了
《Kafka分区副本同步限流机制三部曲》中的第一篇《源码篇》

《图解Kafka中的数据采集和统计机制》

之所以中间插入了《图解Kafka中的数据采集和统计机制》是因为理解了数据的采集和统计机制有利于我们对限流的理解。

今天我们来讲解一下 《Kafka分区副本同步限流机制三部曲》中的第二篇《原理篇》

我们这里讲的限流机制, 只是副本之间的同步限流机制,并不包含 生产者 、消费组 等等其他的限流。

那么讲到副本同步, 我们都知道正常情况下,我们是不会给副本的同步加上限流值的,因为这样子很可能会导致副本跟不上ISR, 那么什么情况下我们需要加上这个限流值呢？

分区副本重分配的场景下,我们可能怕大批量的数据进行迁移会占用过得的资源,导致kafka集群压力增大,影响正常使用, 所以一般情况下我们可能会选择在低峰期进行操作,也会对整个操作做一个限流处理

具体的分区副本重分配的运维操作教程可以看文章【kafka运维】kafka-reassign-partitions.sh分区副本重分配、数据迁移、副本扩缩容 (附教学视频)

设置限流的时候有两个参数选项,可以同时配置

--replica-alter-log-dirs-throttle: broker内部副本跨路径迁移数据流量限制功能，限制数据拷贝从一个目录到另外一个目录带宽上限单位 bytes/sec 。

--throttle: 迁移过程Broker之间传输的速率,单位 bytes/sec

如果你之前看过我写的【kafka运维】kafka-reassign-partitions.sh分区副本重分配、数据迁移、副本扩缩容 (附教学视频)
肯定对这个两个参数非常熟悉。

那么你会不会发出这样的疑问

--throttle: 迁移过程Broker之间传输的速率。这个Broker之间是谁和谁之间？
Broker之间传输的速率怎么算？是Broker整体所有分区副本的传输速率,还是指定几个分区副本的传输速率？
这个传输速率是什么？是Broker数据流出的速率,还是数据流入的速率？还是网卡的速率?
--replica-alter-log-dirs-throttle 这个又是怎么限制住 Broker 不同目录直接的流量的？
如何正确的设置这些限流值呢？有哪些参考标准？
我可以手动设置限流吗？

假如你有这些疑问, 并稍作思考🤔之后, 跟着我下面的讲解来重新梳理一下吧！

不同Broker之间副本同步限流

注意: 这里的副本限流前提是不在ISR中, 如果已经在ISR中了不管如何都不会被限流。

对于这个问题,我写一个例子,就很容易明白了。
当前我有3个Broker，有一个Topic

在执行以下脚本进行分区重分配之后：


sh bin/kafka-reassign-partitions.sh  --zookeeper xxxx:2181/src1 --reassignment-json-file config/reassignment-json-file.json --execute --bootstrap-server xxxxxx:9090 --throttle 1048576

可以看到zk的配置中新增了以下几个属性:

Broker节点配置

/config/brokers/0
/config/brokers/1
/config/brokers/2
这三个Broker都新增了属性


{
	"version": 1,
	"config": {
		"leader.replication.throttled.rate": "1048576",
		"follower.replication.throttled.rate": "1048576"
	}
}

leader.replication.throttled.rate： 需要对Leader端 Fetcher返回的数据做限流,这里的配置就是限流的阈值
follower.replication.throttled.rate: 需要对Follower端去Leader 副本 Fetcher数据做限流,这里的配置就是限流的阈值

可以看到, 里面配置的值都是我刚刚通过--throttle 1048576设置的值也就是说 1M/s.

这里配置了这两个属性的意思是, 3个Broker 既要做Leader端的限流又要做 Follower 端的限流。
并且限流的阈值都是 1M/s.

当然, 这里配置了限流阈值就完了吗？

是需要所有的数据流入流出都要限流? 还是只是部分分区限流？

Topic节点配置

/config/topics/Topic1 新增了以下几个配置

{
	"version": 1,
	"config": {
		"leader.replication.throttled.replicas": "1:1,1:0,0:0,0:1",
		"follower.replication.throttled.replicas": "1:2,0:2"
	}
}

leader.replication.throttled.replicas: Leader端的限流副本, 他的格式是 分区号：BrokerID 上面配置的意思如下

1：1: Topic1-1分区在Broker-1 上需要做Leader限流
1：0: Topic1-1分区在Broker-0 上需要做Leader限流
0：0: Topic1-0分区在Broker-0 上需要做Leader限流
0：1: Topic1-0分区在Broker-1 上需要做Leader限流

从这里可以看到, 基本上原始分区副本都需要配置Leader端进行限流,并且是所有涉及到的Broker

为什么呢？
因为在副本分配过程中,以前的所有副本都有可能成为Leader

比如之前 Broker-0里面的Topic1-0 是Leader副本,如果Broker-0不小心宕机了,那么Leader就变成了Broker-1中的副本了。
所以需要把之前的所有副本都要设置Leader限流。

follower.replication.throttled.replicas：Follower端的限流副本，他的格式是 分区号：BrokerID 上面配置的意思如下

1：2: Topic1-1分区在Broker-2 上需要做Follower限流
0：2: Topic1-0分区在Broker-2 上需要做Follower限流

这里更简单一点, 相当于是新增的副本和对应的Broker都做 Follower限流。

一句话：重分配后的新增的副本均设置成 Follower副本限流, 重分配前的所有副本均设置成Leader限流

看看整体Leader限流和Follower限流图

看完这个图,给你一个问题思考一下.

如果这个上面的每个分区副本大小都是 100M, 那么上面的配置(限流1M/S) 最终执行完成同步, 需要多长的时间呢？

站在Leader的角度看限流

Broker-0中只有 Topic1-0一个Leader需要进行同步(数据流出),并且只有一个Broker-2上的副本需要同步(同步①)
那么完成同步的时间 = 100M / Leader端的限流 1M/S = 100秒。意思是最少需要100秒

同理
Broker-1 也是最少需要100秒。

站在Follower的角度看限流

Broker-2 因为有2个副本同时在同步, 那么总共需要Fetche的数据量是 100*2 = 200M

然后又因为Follower限流是 1M/S
所以完成同步的时间最少需要 200/1M/S = 200S.

也就是说还没有等到Broker-0 和 Broker-1 达到它的限流值之前, Broker-2 就已经被限流了

所以最终的时间是 200秒。

所以跟你想到的答案一致吗？

各种情况的限流情况

Leader 限流 Follower不限流结论

Leader端的限流只会计算需要被限流的分区流量值。
如果多个副本向Leader端Fetch数据,那么都会被算进限流阈值, 基本上多一个副本就多一倍的时间。

如果有多个Leader分区都限流呢？

按照最终有多少个副本在Fetch数据.

Leader不限流 Follower限流

对应的配置有
follower.replication.throttled.replicas ：Follower分区副本的限流配置
follower.replication.throttled.rate Follower分区副本限流阈值 b/s

Topic1 单分区 2副本和 Topic1 2分区 2 副本

Topic1 多分区多副本

多个分区多个副本在不同的Broker上, 不同的Broker的流量只会算在当台Broker。

上图中的2个Leader 都是100M。

最终决定完成重分配任务关键点是什么？

那就是 Leader端的限流和 Follower端限流谁先达到阈值

Leader端先达到阈值

Follower 先达到阈值

同Broker跨目录同步限流

这个指的是一个Broker可能有多个目录, 我们可能会针对不同目录做一些数据迁移。当然,这个过程也会限流

如何进行跨目录数据迁移,文章已经写好了,下周发,可以先关注我或者加我微信 szzdzhp001 获取最新推文,在这一篇就不详细展开了。

这个就是跨目录数据迁移, 在执行这个操作的时候，设置限流 1M/s
--replica-alter-log-dirs-throttle 1048576

那么会在Broker配置节点新增如下配置
/config/broker/0

{
	"version": 1,
	"config": {
		"replica.alter.log.dirs.io.max.bytes.per.second": "1048576"
	}
}

不用管,其他的分区的配置leader.replication.throttled.replicas和follower.replication.throttled.replicas什么的，不需要, 配置了也不会用，因为这里的限流会把这台里面的所有跨目录同步的数据流量给统计起来并进行限流。

如果上面的两个分区都是100M 那么完成迁移的最小时间是 100M*2 / 1M/s = 200秒。

留一个彩蛋(挖坑)

你知道跨目录迁移的时候,数据是从哪里获取的吗？是从本地呢？还是从Leader分区Fetch呢？

想知道答案, 可以关注石臻臻, 或者加微信 szzdzhp001 获取最新推送
我们下次专门来分析一下 跨目录迁移的运维操作和原理解析

如何手动设置限流

我们分析了分区副本同步过程中的所有情况, 也知道了里面的底层原理, 想要手动配置限流信息那岂不是随便拿捏。

虽然我这里在写如何设置副本同步限流的教程,但是我仍然不推荐我们主动来设置它, 因为很有可能会导致你的副本同步变慢, ISR 跟不上。

我们之前写过一篇关于kafka的动态配置运维操作和动态配置的原理解析

如下所示, 可以访问我的个人网站 szzdzhp.com/kafka (石臻臻的杂货铺首字母) 查看kafka运维大全

这里的配置就是动态配置, 实时生效的动态配置。

设置相关配置属性

设置Broker-0的Leader和Follower限流速率


sh bin/kafka-configs.sh   --bootstrap-server xxxxx:9092 --alter  --entity-type brokers --entity-name 0 --add-config leader.replication.throttled.rate=1048576,follower.replication.throttled.rate=1048576

效果如下


{
	"version": 1,
	"config": {
		"leader.replication.throttled.rate": "1048576",
		"follower.replication.throttled.rate": "1048576"
	}
}

当然如果设置 replica-alter-log-dirs-throttle 话更改上面的配置就行了。

设置Topic1的某些分区需要进行限流

我们设置
Topic1-1 需要再Broker-0 上进行Leader限流
Topic1-2 需要再Broker-1 上进行Follower限流


sh bin/kafka-configs.sh   --bootstrap-server xxxxx:9092 --alter  --entity-type topic --entity-name Topic1 --add-config leader.replication.throttled.replicas=1:0,follower.replication.throttled.replicas=2:1

最终效果
/config/topics/Topic1 新增了以下几个配置

{
	"version": 1,
	"config": {
		"leader.replication.throttled.replicas": "1:0",
		"follower.replication.throttled.replicas": "2:1"
	}
}

设置Topic1的所有分区在所有Broker上都需要进行限流

只需要把值设置为 * 就行了


sh bin/kafka-configs.sh   --bootstrap-server xxxxx:9092 --alter  --entity-type brokers --entity-name 0 --add-config leader.replication.throttled.replicas=*,follower.replication.throttled.replicas=*

最终效果
/config/topics/Topic1 新增了以下几个配置

{
	"version": 1,
	"config": {
		"leader.replication.throttled.replicas": "*",
		"follower.replication.throttled.replicas": "*"
	}
}

再留一个彩蛋(挖坑)

如果你执行分区副本重分配忘记执行--verify 没有删除限流配置, 你应该知道如何做的吧？

如何设置合理的限流值呢？

这是一个值得思考的问题, 我们在设置限流值的时候往往可能是根据以往的时候 Broker的网卡流量
还有预估这个Broker可能出现能够承载的最大流量, 然后设置一个合理的范围值, 但是这个合理的限流值应该是什么呢？

还要考虑哪些因素呢？

一台Broker上的网卡流量除了副本同步的流量还有哪些流量呢？

这值得我们专门写一篇文章来分析！

我是石臻臻, 下次见！

👇🏻 扫描下方 关注公众号 参与每周福利👇🏻

kafka 张图 span class token 面试 big data

有关13张图让你百分百掌握kafka副本同步限流机制的更多相关文章

使用canal同步MySQL数据到ES - 2
文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目，Java开发。基于数据库增量日志解析，提供增量数据订阅&消费。Git地址：https://github.co
ruby - 安装libv8(3.11.8.13)出错，Bundler无法继续 - 2
运行bundleinstall后出现此错误:Gem::Package::FormatError:nometadatafoundin/Users/jeanosorio/.rvm/gems/ruby-1.9.3-p286/cache/libv8-3.11.8.13-x86_64-darwin-12.gemAnerroroccurredwhileinstallinglibv8(3.11.8.13),andBundlercannotcontinue.Makesurethat`geminstalllibv8-v'3.11.8.13'`succeedsbeforebundling.我试试gemin
ruby-on-rails - gem install rmagick -v 2.13.1 错误 Failed to build gem native extension on Mac OS 10.9.1 - 2
我已经通过提供MagickWand.h的路径尝试了一切，我安装了命令工具。谁能帮帮我？$geminstallrmagick-v2.13.1Buildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingrmagick:ERROR:Failedtobuildgemnativeextension./Users/ghazanfarali/.rvm/rubies/ruby-1.8.7-p357/bin/rubyextconf.rbcheckingforRubyversion>=1.8.5...yescheckingfor/
映宇宙2022年营收63亿元：同比下降三成，毛利率提升4.3个百分点 - 2
3月26日，映宇宙（HK:03700，即“映客”）发布截至2022年12月31日的2022年度业绩财务报告。财报显示，映宇宙2022年的总营收为63.19亿元，较2021年同期的91.76亿元下降31.1%。2022年，映宇宙的经营亏损为4698.7万元，2021年同期则为净利润4.57亿元；期内亏损（净亏损）为1.68亿元，2021年同期的净利润为4.33亿元；非国际财务报告准则经调整净利润为3.88亿元，2021年同期为4.82亿元，同比下降19.6%。映宇宙在财报中表示，收入减少主要是由于行业竞争加剧，该集团对旗下产品采取更为谨慎的运营策略以应对市场变化。不过，映宇宙的毛利率则有所提升
ruby-on-rails - 本地 yaml key 的 i18n 同步 - 2
类似的问题，但对于java，Keepingi18nresourcessynced如何保持i18nyamllocals的key同步？即，当将key添加到en.yml时，如何将它们添加到nb.yml或ru.yml？如果我在my_title:"atitle"旁边添加键my_label:"sometextinenglish"我想把它给我的其他本地人我指定，因为我不能做所有的翻译，它应该回到其他语言的英语例如en.ymlsomegroup:my_tile:"atitleinenglish"my_label:"sometextinenglish"othergroup:...我想发出命令，将整个键和
ruby-on-rails - Heroku 错误 H13 - 2
自从我将我的应用程序部署到heroku以来，在过去的几天里，我一直在断断续续地收到这个错误。它发生在我开始使用unicorn作为服务器之前和之后。有时我可以通过使用herokurunrakedb:migrate然后herokurestart让它恢复运行，但这只修复了几个小时，它又坏了。至于网页，它说“应用程序错误”。日志不是很有用，但每次发生此错误时都会显示以下内容:[2014-10-27T21:13:31.675956#2]ERROR--:worker=1PID:8timeout(16s>15s),killing[2014-10-27T21:13:31.731646#14]INFO-
ruby-on-rails - ArgumentError(Api::V1 的副本已从模块树中删除但仍处于事件状态!) - 2
这几天我一直在为这个问题苦苦挣扎。我有一个正在为其构建一些API的应用程序，并且上述错误总是在第一次运行时使我的应用程序崩溃。重新加载应用程序时错误消失，但仍然很烦人。以下是关于此错误的一些类似问题:AcopyofxxxhasbeenremovedfromthemoduletreebutisstillactiveArgumentError:AcopyofApplicationControllerhasbeenremovedfromthemoduletreebutisstillactive这两个链接都没有解决我面临的问题。这是完整的堆栈跟踪:ArgumentError(AcopyofAp
好的代码风格，如同书法，让你的代码更加漂亮 - 2
很多初学者的代码其实都不够“漂亮”，那是因为没有养成好的编码习惯。本篇博客以C语言为例，总结一些好习惯。其实，很多习惯都是肌肉记忆，举个例子：请你写一个程序，输入2个整数并输出它们的和。有些朋友可能写出来是这个样子。#includeintmain(){ inta=0; intb=0; intsum=0; scanf("%d%d",&a,&b); sum=a+b; printf("%d\n",sum); return0;}我写这段代码，是在模仿有些朋友在初学的时候容易写成的样子。更有甚者，写成这个样子：#includeintmain(){inta=0;intb=0;intsum=0;scanf(
ruby - 为什么百分号中使用不同的分隔符？ - 2
我见过不同的人为此使用不同类型的牙套/括号。我在脚本控制台中试用了它们，它们都有效。为什么它们都有效？使用哪个有关系吗？%w|onetwo|%w{onetwo}%w[onetwo]%w(onetwo)实际上，可以使用更多种类的字符。可以使用除=之外的任何非字母数字字符。%w!a!%w@b@%w#c#%w$d$%w%e%%w^f^%w&g&%w*h*%w(i)%w_j_%w-k-%w+l+%w\m\%w|n|%w`o`%w~p~%w[q]%w{r}%w;s;%w:t:%w'u'%w"v"%w,w,%w%w.y.%w/z/%w?aa? 最佳答案
一文让你彻底掌握操作符（超详细教程） - 2
✅作者简介：大家好，我是小杨📃个人主页：「小杨」的csdn博客🔥系列专栏：小杨带你玩转C语言【初阶】🐳希望大家多多支持🥰一起进步呀！大家好呀！我是小杨。小杨花几天的时间将C语言中的操作符这部分知识做了一个大总结，在方便自己复习的同时也能够帮助到大家。通篇字数在一万字左右，可以算作是非常详细了，一文就可以带领大家彻底掌握操作符这部分内容，文章很长建议先收藏再看，防止下次想看就找不到啦。文章目录✍1，算术操作符✍2，移位操作符 🔍2.1,左移操作符 🔍2.2,右移操作符 ✨2.2.1,算术移位 ✨2.2.2,逻辑移位✍3，位操作符 🔍3.1,按位与&