草庐IT

Kafka-Source

全部标签

Kafka详解(中)——Kafka客户端操作

3-1shell列举​kafka安装目录下的bin目录包含了很多运维可操作的shell脚本,列举如下:脚本名称用途描述connect-distributed.sh连接kafka集群模式connect-standalone.sh连接kafka单机模式kafka-acls.sh设置Kafka权限kafka-broker-api-versions.sh检索代理版本信息kafka-configs.sh配置管理脚本kafka-console-consumer.shkafka消费者控制台kafka-console-producer.shkafka生产者控制台kafka-consumer-groups.sh

Kafka 原理篇

作者:码哥字节今天我们来深入讲解Kafka的架构和实现原理。我将从架构和细节入手,以生动的图深入讲解Kafka的实现原理。我想很多同学之前可能已经看过很多Kafka原理相关的文章,但往往看时"牛逼"声连连,激情满满,总觉得自己又学习到了各种“吊炸天”的技术。但很多同学往往是不觉明厉,把文章结合面试题背一背还能应付一下半吊子面试官。可以遇到老司机面试官,或是进入实战,却对很多概念和实现摸棱两可。所以,我决定图解Kakfa,却让很多半懂不懂的同学可以加深对Kafka实现原理的理解。同时建议读者同学结合Kafka的配置去了解Kafka的实现原理,Kafka有大量的配置,这也是Kafka高度扩展的一个

Flink SQL和Table API实现消费kafka写入mysql

FlinkSQL和TableAPI实现消费kafka写入mysql1、构建table环境//创建flink流处理环境StreamExecutionEnvironmentenv=StreamExecutionEnvironment.getExecutionEnvironment();env.setParallelism(1);//table环境StreamTableEnvironmenttableEnv=StreamTableEnvironment.create(env);2、构建sourcekafka方式一:API//Kafka连接器Kafkakafka=newKafka()        .

kafka入门(四):kafka生产者发送消息

创建生产者实例和构建消息之后,就可以开始发送消息了。发送消息主要有三种模式:发后即忘、同步、异步。发后即忘:就是直接调用生产者的send方法发送。发后即完,只管往kafka中发送消息,而不关心消息是否正确到达。这种发送方式的性能最高,可靠性也最差。producer.send(record);具体代码如下:publicclassKafkaDemoProducer{publicstaticfinalStringBROKER_LIST="localhost:9092";publicstaticfinalStringTOPIC="myTopic1";publicstaticvoidmain(Strin

Kafka可视化利器 KafkaTool 发送kafka消息

kafak是我们工作中常用的消息组件,今天在跟合作方联调的时候被告知上游没有准备好消息数据,没有办法从依赖方拿到消息但是我们还又想测试自己写的消息消费的代码,怎么办呢?常规的做法就是把消息消费的代码抽离出来包装成一个公共方法,提供一个Controller直接构造好参数调用一下验证。或者写单元测试,都可以达到咱们的目的。但是总感觉想通过Kafka进行验证代码逻辑,有么有好的办法呢,答案肯定是有的,就是使用KafkaTool模拟生产者发送消息,进行消费。今天在操作的时候走了一些弯路在网上也查了一下相关文档,结果有很多不是很好,遂记录下来供大家参考。第一步:安装KafkaTool这里就不对描述了。我

Kafka干货之「零拷贝」

一、背景周所周知,Kafka是一个非常成熟的消息产品,开源社区也已经经历了多年的不断迭代,特性列表更是能装下好几马车,比如:幂等消息、事务支持、多副本高可用、ACL、AutoRebalance、HW、LeaderEpoch、TimeIndex、ProducerSnapshot、Stream、Connector、多级存储、MirrorMaker、消息压缩、FetchSession、Metrics、Quota等等,Kafka的特性列表真要往出列的话,可能会占满半个屏幕然后我们今天不去探讨这些“炫酷”的feature,只将目光聚焦在消息的生产、存储、消费上,同时这3个功能也是大部分用户接触最多、最基

RabbitMQ 和 Kafka 对比

本文对RabbitMQ和Kafka进行下比较文章目录前言RabbitMQ架构队列消费队列生产Kafka本文小结前言开源社区有好多优秀的队列中间件,比如RabbitMQ和Kafka,每个队列都貌似有其特性,在进行工程选择时,往往眼花缭乱,不知所措。对于RabbitMQ和Kafka,到底应该选哪个?RabbitMQ架构RabbitMQ是一个分布式系统,这里面有几个抽象概念。broker:每个节点运行的服务程序,功能为维护该节点的队列的增删以及转发队列操作请求。masterqueue:每个队列都分为一个主队列和若干个镜像队列。mirrorqueue:镜像队列,作为masterqueue的备份。在ma

【flink番外篇】3、flink的source(内置、mysql、kafka、redis、clickhouse)介绍及示例(3)- kafka

Flink系列文章一、Flink专栏Flink专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、Flink部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink的基础部分,比如术语、架构、编程模型、编程指南、基本的datastreamapi用法、四大基石等内容。3、FlikTableAPI和SQL基础系列本部分介绍FlinkTableApi和SQL的基本用法,比如TableAPI和SQL创建库、表用法、查询、窗口函数、catalog等等内容。4、FlikTableAPI和SQL提高与应用系列本部分是tableapi和sql的应用部分,和实际的生产应

Kafka干货之「零拷贝」

一、背景周所周知,Kafka是一个非常成熟的消息产品,开源社区也已经经历了多年的不断迭代,特性列表更是能装下好几马车,比如:幂等消息、事务支持、多副本高可用、ACL、AutoRebalance、HW、LeaderEpoch、TimeIndex、ProducerSnapshot、Stream、Connector、多级存储、MirrorMaker、消息压缩、FetchSession、Metrics、Quota等等,Kafka的特性列表真要往出列的话,可能会占满半个屏幕然后我们今天不去探讨这些“炫酷”的feature,只将目光聚焦在消息的生产、存储、消费上,同时这3个功能也是大部分用户接触最多、最基

kafka max.poll.records用法介绍

一、max.poll.records是什么max.poll.records是Kafkaconsumer的一个配置参数,表示consumer一次从Kafkabroker中拉取的最大消息数目。默认值为500条。在Kafka中,一个consumergroup可以有多个consumer实例,每个consumer实例负责消费一个或多个partition的消息。每个consumer实例从broker中拉取消息可以拉取一个或多个消息。max.poll.records参数的作用就是控制每次拉取消息的最大数目,以实现消费弱化和控制内存资源的需求。二、max.poll.records的配置方法在Kafkacons