草庐IT

Kafka-eagle

全部标签

Kafka环境搭建

1.将软件包kafka_2.12-3.0.0.tgz上传到/opt/software/目录下,解压到/opt/module/目录下tar-zxvfkafka_2.12-3.0.0.tgz-C/opt/module/2.修改解压后的文件名称  mvkafka_2.12-3.0.0/kafka  3.进入到/opt/module/kafka目录,修改配置文件cdconfig/vimserver.properties找到log.dirs,并修改成下面代码log.dirs=/opt/module/kafka/datas找到zookeeper.connect,并修改成下面代码zookeeper.conn

Kafka环境搭建

1.将软件包kafka_2.12-3.0.0.tgz上传到/opt/software/目录下,解压到/opt/module/目录下tar-zxvfkafka_2.12-3.0.0.tgz-C/opt/module/2.修改解压后的文件名称  mvkafka_2.12-3.0.0/kafka  3.进入到/opt/module/kafka目录,修改配置文件cdconfig/vimserver.properties找到log.dirs,并修改成下面代码log.dirs=/opt/module/kafka/datas找到zookeeper.connect,并修改成下面代码zookeeper.conn

大数据Hadoop之——Flink CEP(Complex Event Processing:复合事件处理)详解(kafka on window)

目录一、概述二、核心组件三、PatternAPI1)个体模式(IndividualPatterns)1、量词2、条件2)组合模式(CombiningPatterns,也叫模式序列)1、事件之间的连续策略2、循环模式中的连续性3)模式组(GroupofPattern)匹配后跳过策略四、Pattern检测五、FlinkCEP应用场景六、安装Kafka(window)1)下载kafka2)配置环境变量3)创建相关文件4)修改配置5)启动zookeeper和kafka服务6)常用操作七、FlinkCEP实战(java版)1)开发流程2)FlinkCEP快速上手1、配置Maven2、下载项目3、执行解析

大数据Hadoop之——Flink CEP(Complex Event Processing:复合事件处理)详解(kafka on window)

目录一、概述二、核心组件三、PatternAPI1)个体模式(IndividualPatterns)1、量词2、条件2)组合模式(CombiningPatterns,也叫模式序列)1、事件之间的连续策略2、循环模式中的连续性3)模式组(GroupofPattern)匹配后跳过策略四、Pattern检测五、FlinkCEP应用场景六、安装Kafka(window)1)下载kafka2)配置环境变量3)创建相关文件4)修改配置5)启动zookeeper和kafka服务6)常用操作七、FlinkCEP实战(java版)1)开发流程2)FlinkCEP快速上手1、配置Maven2、下载项目3、执行解析

Golang:将日志以Json格式输出到Kafka

在上一篇文章中我实现了一个支持Debug、Info、Error等多个级别的日志库,并将日志写到了磁盘文件中,代码比较简单,适合练手。有兴趣的可以通过这个链接前往:https://github.com/bosima/ylog/releases/tag/v1.0.1工程实践中,我们往往还需要对日志进行采集,将日志归集到一起,然后用于各种处理分析,比如生产环境上的错误分析、异常告警等等。在日志消息系统领域,Kafka久负盛名,这篇文章就以将日志发送到Kafka来实现日志的采集;同时考虑到日志分析时对结构化数据的需求,这篇文章还会提供一种输出Json格式日志的方法。这个升级版的日志库还要保持向前兼容,

Golang:将日志以Json格式输出到Kafka

在上一篇文章中我实现了一个支持Debug、Info、Error等多个级别的日志库,并将日志写到了磁盘文件中,代码比较简单,适合练手。有兴趣的可以通过这个链接前往:https://github.com/bosima/ylog/releases/tag/v1.0.1工程实践中,我们往往还需要对日志进行采集,将日志归集到一起,然后用于各种处理分析,比如生产环境上的错误分析、异常告警等等。在日志消息系统领域,Kafka久负盛名,这篇文章就以将日志发送到Kafka来实现日志的采集;同时考虑到日志分析时对结构化数据的需求,这篇文章还会提供一种输出Json格式日志的方法。这个升级版的日志库还要保持向前兼容,

合理安排kafka的broker、partition、consumer数量

broker的数量最好大于等于partition数量一个partition最好对应一个硬盘,这样能最大限度发挥顺序写的优势。一个broker如果对应多个partition,需要随机分发,顺序IO会退化成随机IO。实验条件:3个Broker,1个Topic,无Replication,异步模式,3个Producer,消息Payload为100字节:第一阶段:当Partition数量小于Broker个数时,Partition数量越大,吞吐率越高,且呈线性提升。Kafka会将所有Partition均匀分布到所有Broker上,所以当只有2个Partition时,会有2个Broker为该Topic服务。

合理安排kafka的broker、partition、consumer数量

broker的数量最好大于等于partition数量一个partition最好对应一个硬盘,这样能最大限度发挥顺序写的优势。一个broker如果对应多个partition,需要随机分发,顺序IO会退化成随机IO。实验条件:3个Broker,1个Topic,无Replication,异步模式,3个Producer,消息Payload为100字节:第一阶段:当Partition数量小于Broker个数时,Partition数量越大,吞吐率越高,且呈线性提升。Kafka会将所有Partition均匀分布到所有Broker上,所以当只有2个Partition时,会有2个Broker为该Topic服务。

大数据Hadoop之——Flink Table API 和 SQL(单机Kafka)

目录一、TableAPI和FlinkSQL是什么二、配置Table依赖(scala)三、两种planner(old&blink)的区别四、Catalogs1)Catalog概述2)Catalog类型3)如何创建Flink表并将其注册到Catalog1、下载flink-sql-connector-hive相关版本jar包,放在$FLINK_HOME/lib目录下2、添加Maven依赖2、使用SQLDDL五、SQL客户端1)启动SQL客户端命令行界面2)执行SQL查询1、standalone模式(默认)2、yarn-session模式(常驻集群)3、启动sql-clientonyarn-sessi

大数据Hadoop之——Flink Table API 和 SQL(单机Kafka)

目录一、TableAPI和FlinkSQL是什么二、配置Table依赖(scala)三、两种planner(old&blink)的区别四、Catalogs1)Catalog概述2)Catalog类型3)如何创建Flink表并将其注册到Catalog1、下载flink-sql-connector-hive相关版本jar包,放在$FLINK_HOME/lib目录下2、添加Maven依赖2、使用SQLDDL五、SQL客户端1)启动SQL客户端命令行界面2)执行SQL查询1、standalone模式(默认)2、yarn-session模式(常驻集群)3、启动sql-clientonyarn-sessi