草庐IT

大数据Flink(五十八):Flink on Yarn的三种部署方式介绍

文章目录FlinkonYarn的三种部署方式介绍一、​​​​​​​Session模式

开源XL-LightHouse与Flink、ClickHouse之类技术相比有什么优势

Flink是一款非常优秀的流式计算框架,而ClickHouse是一款非常优秀的OLAP类引擎,它们是各自所处领域的佼佼者,这一点是毋庸置疑的。Flink除了各种流式计算场景外也必然可以用于流式统计,ClickHouse同样也可以用于流式统计,但我不认为它们是优秀的流式统计工具。XL-Lighthouse在流式统计这个细分场景内足以完胜Flink和ClickHouse。在企业数据化运营领域,面对繁杂的流式数据统计需求,以Flink和ClickHouse以及很多同类技术方案为核心的架构设计不能算是一种较为优秀的解决方案。一、从流式统计的特点说起1、流式统计是流式计算中的一种特殊运算形式一个Flin

flink mysql cdc调试问题记录

最近需要用到flinkcdc作为数据流处理框架,在demo运行中发现一些问题,特此记录问题和解决过程。无法读取tableCausedby:java.lang.IllegalArgumentException:Can'tfindanymatchedtables,pleasecheckyourconfigureddatabase-name:[localdb]andtable-name:[flink_cdc_message]atcom.ververica.cdc.connectors.mysql.debezium.DebeziumUtils.discoverCapturedTables(Debezi

Flink - checkpoint Failure reason: Not all required tasks are currently running

问题:任务正常运行,但是一直没有触发检查点,或者检查点失败各task检查点进度为0,手动触发检查点报错。原因:任务有两个source,source1运行几秒后相应的task变为finished状态,而存储checkpoint需要所有task处于Running状态。虽然无法存储checkpoint,但是不会影响任务的执行,所以没有曝出error信息。解决:修改自定义source1中重写的run()方法,加上while(true)使source保持running状态。附:FlinkCheckpoint流程与原理主要内容:预检查,比如检查最大并发的Checkpoint数,最小的Checkpoint之

Zookeeper+Hadoop+Spark+Flink+Kafka+Hbase+Hive 完全分布式高可用集群搭建(保姆级超详细含图文)

说明:本篇将详细介绍用二进制安装包部署hadoop等组件,注意事项,各组件的使用,常用的一些命令,以及在部署中遇到的问题解决思路等等,都将详细介绍。1.环境说明1.1ip规划iphostname192.168.1.11node1192.168.1.12node2192.168.1.13node31.2系统配置1.2.1系统版本[root@localhost~]#cat/etc/redhat-releaseCentOSLinuxrelease7.9.2009(Core)1.2.2内存建议最少4g、2cpu、50G以上的磁盘容量[root@localhost~]#free-htotalusedfr

Flink Table/Sql自定义Kudu Sink实战(其它Sink可参考)

目录1.背景2.原理3.通过Trino创建Kudu表4.FlinkKuduTableSinkProject项目4.1pom.xml4.2FlinkKuduTableSinkFactory.scala4.3META-INF/services4.4FlinkKuduTableSinkTest.scala测试文件5.查看Kudu表数据1.背景使用第三方的org.apache.bahir»flink-connector-kudu,batch模式写入数据到Kudu会有FlushMode相关问题具体可以参考我的这篇博客通过FlinkSQL操作创建Kudu表,并读写Kudu表数据2.原理Flink的Dyna

flink-conf.yaml的参数

参数⚫jobmanager.memory.process.size:对JobManager进程可使用到的全部内存进行配置,包括JVM元空间和其他开销,默认为1600M,可以根据集群规模进行适当调整。⚫taskmanager.memory.process.size:对TaskManager进程可使用到的全部内存进行配置,包括JVM元空间和其他开销,默认为1600M,可以根据集群规模进行适当调整。⚫taskmanager.numberOfTaskSlots:对每个TaskManager能够分配的Slot数量进行配置,默认为1,可根据TaskManager所在的机器能够提供给Flink的CPU数量决

Flink web UI配置账号密码,权限控制

由于Flink自带的webUI界面没有账号密码,需要通过nginx实现该效果。 1.安装httpd-tools工具yuminstallhttpd-tools-y2.生成用户名密码文件htpasswd-c/usr/local/nginx/conf/flinkuserusername passwd flinkuser:为生成的用户名密码文件名称username:用户名passwd:密码3.nginx配置  

Flink正常消费一段时间后,大量反压,看着像卡住了,但又没有报错。

文章目录前言一、原因分析二、解决方案前言前面我也有提到,发现flink运行一段时间后,不再继续消费的问题。这个问题困扰了我非常久,一开始也很迷茫。又因为比较忙,所以一直没有时间能够去寻找答案,只是通过每天重启的方式去解决。经过分析,其实这个问题也很容易找到根源,有兴趣就和我一起看下叭一、原因分析首先介绍一下这个程序大概流程,比较简单。一个输入源,经过一个算子,最后开了三个窗口。并行度都写在括号里了。下面这是一张taskmanager的cpu使用率,可以看出,到最后要停掉前也没有出现cpu高飘的情况,并且心跳依然存在,程序还是在继续运行的。我们从flink运行图上面可以看到,反压很严重矛盾就出现

flink启动报错Failed to construct kafka producer

flinklocal模式下启动sink2kafka报错,具体报错如下apache.kafka.common.KafkaException: Failed to construct kafka producer    at org.apache.kafka.clients.producer.KafkaProducer.(KafkaProducer.java:432)    at org.apache.kafka.clients.producer.KafkaProducer.(KafkaProducer.java:298)    at org.apache.flink.connector.kafk