草庐IT

Dinky,让 Flink SQL 纵享丝滑

大家好,我是脚丫先生流批一体,越来越流行了,牛逼一体。之前用java封装flink-sql-client提交脚本文件,很是摩擦。不过,在研发流批一体平台的时候发现了Dinky,终于丝滑了。今天就给小伙伴们推荐下低调但实力强大的Dinky!功能强大,解放自己。Dinky基于ApacheFlink二次开发,无侵入,开箱即用实时即未来,批流为一体。用好Dinky,无限丝滑。官方网站官方有着详细的使用教程,并且已经开源了。最重要的是可以加入交流群,随时问作者(比较耐心的一个大佬)。Dinky平台搭建Dinky,跟着官方搭建教程一步一操作,比较简单。作为FlinSQL实时计算平台,其核心功能:支持Fli

Flink 部署

这里需要提到Flink中的几个关键组件:客户端(Client)、作业管理器(JobManager)和任务管理器(TaskManager)。我们的代码,实际上是由客户端获取并做转换,之后提交给JobManger的。所以JobManager就是Flink集群里的“管事人”,对作业进行中央调度管理;而它获取到要执行的作业后,会进一步处理转换,然后分发任务给众多的TaskManager。这里的TaskManager,就是真正“干活的人”,数据的处理操作都是它们来做的,一、快速启动一个Flink集群1.环境配置Flink是一个分布式的流处理框架,所以实际应用一般都需要搭建集群环境。我们在进行Flink安

Flink 部署

这里需要提到Flink中的几个关键组件:客户端(Client)、作业管理器(JobManager)和任务管理器(TaskManager)。我们的代码,实际上是由客户端获取并做转换,之后提交给JobManger的。所以JobManager就是Flink集群里的“管事人”,对作业进行中央调度管理;而它获取到要执行的作业后,会进一步处理转换,然后分发任务给众多的TaskManager。这里的TaskManager,就是真正“干活的人”,数据的处理操作都是它们来做的,一、快速启动一个Flink集群1.环境配置Flink是一个分布式的流处理框架,所以实际应用一般都需要搭建集群环境。我们在进行Flink安

Flink 滚动窗口、滑动窗口详解

1滚动窗口(TumblingWindows)滚动窗口有固定的大小,是一种对数据进行“均匀切片”的划分方式。窗口之间没有重叠,也不会有间隔,是“首尾相接”的状态。如果我们把多个窗口的创建,看作一个窗口的运动,那就好像它在不停地向前“翻滚”一样。这是最简单的窗口形式,我们之前所举的例子都是滚动窗口。也正是因为滚动窗口是“无缝衔接”,所以每个数据都会被分配到一个窗口,而且只会属于一个窗口。滚动窗口可以基于时间定义,也可以基于数据个数定义;需要的参数只有一个,就是窗口的大小(windowsize)。比如我们可以定义一个长度为1小时的滚动时间窗口,那么每个小时就会进行一次统计;或者定义一个长度为10的滚

Flink 滚动窗口、滑动窗口详解

1滚动窗口(TumblingWindows)滚动窗口有固定的大小,是一种对数据进行“均匀切片”的划分方式。窗口之间没有重叠,也不会有间隔,是“首尾相接”的状态。如果我们把多个窗口的创建,看作一个窗口的运动,那就好像它在不停地向前“翻滚”一样。这是最简单的窗口形式,我们之前所举的例子都是滚动窗口。也正是因为滚动窗口是“无缝衔接”,所以每个数据都会被分配到一个窗口,而且只会属于一个窗口。滚动窗口可以基于时间定义,也可以基于数据个数定义;需要的参数只有一个,就是窗口的大小(windowsize)。比如我们可以定义一个长度为1小时的滚动时间窗口,那么每个小时就会进行一次统计;或者定义一个长度为10的滚

Flink第一章:环境搭建

系列文章目录Flink第一章:环境搭建文章目录系列文章目录前言一、Idea项目1.创建项目2.pom.依赖3.DataSet4.DataStreaming二、环境搭建1.Standalone2.FlinkonYarn总结前言Flink也是现在现在大数据技术中火爆的一门,反正大数据的热门技术学的也差不多了,啃完Flink基本的大数据技术就差不多哦学完了.一、Idea项目1.创建项目略2.pom.依赖这里说明一下我选择的环境.java8scala2.12flink采用最新的1.17请大家根据自己的环境更换版本?xmlversion="1.0"encoding="UTF-8"?>projectxml

使用 Flink CDC 实现 MySQL 数据实时入 Apache Doris

简介主要内容如下:MySQL安装和开启binogFlink环境准备ApacheDoris环境准备启动FlinkCDC作业1.MySQL安装和开启binog参考文章:Ubuntu安装Mysqlserver,这篇文章介绍了MySQL的安装,用户创建,Binlog开启等内容。MySQL安装后之后创建表,插入测试数据CREATETABLE`test`.`products`(`id`int(11)NOTNULLAUTO_INCREMENT,`name`varchar(255)NOTNULL,`description`varchar(512)DEFAULTNULL,`address`varchar(50)

使用 Flink CDC 实现 MySQL 数据实时入 Apache Doris

简介主要内容如下:MySQL安装和开启binogFlink环境准备ApacheDoris环境准备启动FlinkCDC作业1.MySQL安装和开启binog参考文章:Ubuntu安装Mysqlserver,这篇文章介绍了MySQL的安装,用户创建,Binlog开启等内容。MySQL安装后之后创建表,插入测试数据CREATETABLE`test`.`products`(`id`int(11)NOTNULLAUTO_INCREMENT,`name`varchar(255)NOTNULL,`description`varchar(512)DEFAULTNULL,`address`varchar(50)

Flink二阶段提交

Flink二阶段提交一、引申(什么是XA事务)二、Flink二阶段提交2.1引入EXACTLY_ONCE语义2.2Kafka幂等性和事务性2.3Flink二阶段提交一、引申(什么是XA事务)XA(eXtendedArchitecture)是指由X/Open组织提出的分布式交易处理的规范。XA是一个分布式事务协议,由Tuxedo提出,所以分布式事务也称为XA事务。XA协议主要定义了事务管理器TM(TransactionManager,协调者)和资源管理器RM(ResourceManager,参与者)之间的接口。其中,资源管理器往往由数据库实现,如Oracle、DB2、MySQL,这些商业数据库都

flink开发常见问题 —— flink-kafka 依赖版本冲突问题

问题描述由于flink/kafka的版本不断更新,创建项目的时候就应当考虑清楚这几个依赖库的版本问题,尽可能地与实际场景保持一致,比如服务器上部署的kafka是哪个版本,flink是哪个版本,从而确定我们需要开发的是哪个版本,并且在真正的开发工作开始之前,应当先测试一下保证kafka的版本、flink的版本一致,至少大版本一致,不存在冲突问题,不要为以后的部署埋坑。解决方案步骤1确定flink/scala/flink-connect-kafka的版本比如flink选择的是1.12.7这个版本,我们前去maven仓库查看flink-connect-kafka的版本。首先访问链接1https://