草庐IT

Kafka的下载安装以及使用

一、Kafka下载下载地址:https://kafka.apache.org/downloads二、Kafka安装因为选择下载的是.zip文件,直接跳过安装,一步到位。选择在任一磁盘创建空文件夹(不要使用中文路径),解压之后把文件夹内容剪切进去(本人选择D:\env-java\路径下,即完成安装)。linux解压命令tar-zxvfkafka_2.13-3.5.1.tgz,linux环境下指令是在\kafka_2.13-3.5.1\bin目录。windows直接解压即可,windows环境下指令是在kafka_2.13-3.5.1\bin\windows目录。注意:不同系统指令所在的目录不同。

二、Kafka生产与消费全流程

Kafka生产与消费全流程Kafka是一款消息中间件,消息中间件本质就是收消息与发消息,所以这节课我们会从一条消息开始生产出发,去了解生产端的运行流程,然后简单的了解一下broker的存储流程,最后这条消息是如何被消费者消费掉的。其中最核心的有以下内容。1、Kafka客户端是如何去设计一个非常优秀的生产级的保证高吞吐的一个缓冲机制2、消费端的原理:每个消费组的群主如何选择,消费组的群组协调器如何选择,分区分配的方法,分布式消费的实现机制,拉取消息的原理,offset提交的原理。Kafka一条消息发送和消费的流程(非集群)简单入门我们这里使用Kafka内置的客户端API开发kafka应用程序。因

大数据课程I1——Kafka的概述

文章作者邮箱:yugongshiye@sina.cn       地址:广东惠州 ▲本章节目的⚪ 了解Kafka的概念;⚪ 掌握Kafka的配置与启动;一、简介1.基本概念Apachekafka是一个分布式数据流平台。可以从如下几个层面来理解:1.我们可以向Kafka发布数据以及从Kafka订阅数据,即我们可以将Kafka看作是一个消息队列或者企业消息系统。所起的作用:缓冲(消峰限流),实现生产与消费的解耦。2.Kafka可以存储数据,并提供容错机制。即数据丢失后可以进行恢复。3.当数据到达Kafka之后,可以马上的被消费处理。即Kafka的延迟很低。我们可以人为Kafka具备以上三个方面的明

Docker 搭建 zookeeper、kafka 集群

1、zookeeper搭建首先创建一个自定义网络,后续的所有容器都放入同一个内网中,容器之间还可以通过容器名称进行直接访问,在后续的配置中只需要写明容器名称即可,会自动找到对应的IP地址,防止重启容器后IP地址发生变化时,还要去修改配置文件的操作dockernetworkcreatekafka-net1、zookeeper单机搭建创建目录mkdir-p/mnt/data/zookeeper/data#数据挂载目录mkdir-p/mnt/data/zookeeper/conf#配置挂载目录mkdir-p/mnt/data/zookeeper/logs#日志挂载目录启动zookeeperdocke

k8s部署kafka集群

前言环境:centos7.9k8s集群、zookeeper集群本篇将在k8s中部署kafka集群,kafka依赖zookeeper集群,zookeeper集群我们已经搭建好了,可以参考https://blog.csdn.net/MssGuo/article/details/127773132制作对应版本的kafka镜像由于k8s官网没有kafka的相关集群安装说明,所以只好手动制作对应版本的kafka镜像。#kafka需要jdk,所以需要下载jdk,JDK的tar包官网:`https://www.oracle.com/java/technologies/downloads/`自行下载;#这里直

【FLINK】Kafka数据源通过Flink-cdc进行实时数据同步

何为FLINK-CDC?CDC是ChangeDataCapture的缩写,中文意思是变更数据获取,flink-cdc的作用是,通过flink捕获数据源的事务变动操作记录,包括数据的增删改操作等,根据这些记录可作用于对目标端进行实时数据同步。下图是flink-cdc最新支持的数据源类型:对有记录事务操作的kafka数据源通过flink-cdc实现实时数据同步kafka的数据源要通过flink-cdc进行实时数据同步,并更新到目标数据库:例如mysql、postgres、oracle等传统关系型数据库,或者是clickhouse、TiDb等关系型数据库,或者是其他,首先要符合以下条件:kafka的

kafka--kafka基础概念-ISR详解

kafka基础概念-ISR详解ISR详解-ISR主要是讲主往从同步中的问题当绿色P1接收到写入的数据,要同步到紫色的P1S1和P1S2如何保证一致性呢?使用InSyncReplicas也就是ISR概念为什么不一致的?因为P1S1同步数据可能花费50msP1S2可能花费60ms同步完的进入ISR集合,同步时间是可以设置规定时间的(容忍时间)没有在规定时间同步完的进入OSR集合绿色部分主要监督紫色部分有没有超时ISR详解—HW–LEOHW:HighWatermark,高水位线,消费者只能最多拉取到高水位线的消息LEO:LogEndOffset,日志文件的最后一条记录的offset(偏移量)ISR集

liunx服务器安装kafka

liunx服务器安装kafka1.初始化安装环境1.1安装jdk1.1.1找到对应的jdk版本1.1.2下载并安装1.1.2.1配置jdk环境变量1.2安装zookeeper1.2.1查找kafka对应zookeeper版本启动2.下载kafka安装包kafka3.0.0之前(包括3.0.0版本)支持jdk8,3.0.0之后版本不再支持jdk8版本,按照官网安装kafka,出现了各种各样的问题。总结:kafka和zookeeper和jdk版本对应,kafka启动报错根据提示改正后需要删除某些临时文件内容。下面整理了kafka安装的完整步骤,适合所有kafka安装版本1.初始化安装环境1.1安装

大数据学习:kafka-producer源码分析

kafka-producer源码分析kafka-1.0.1源码下载地址一.kafka发送示例/***CreatedbyXiChuanon2021/6/7.*/publicclassProducerTest{publicstaticvoidmain(String[]args)throwsException{KafkaProducerString,String>producer=createProducer();JSONObjectorder=createRecord();ProducerRecordString,String>record=newProducerRecordString,Stri

kafka常用命令

查看主题./kafka-topics.sh--list--bootstrap-server10.1.1.2:9092创建主题./kafka-topics.sh--bootstrap-server10.1.1.2:9092--create--topicmytopic--partitions1 查看消费者列表--list./kafka-consumer-groups.sh--bootstrap-server10.1.1.2:9092--list查看消费者组详情--describe查看指定消费组详情--group./kafka-consumer-groups.sh--bootstrap-server