草庐IT

Flink部署

目录快速启动一个Flink集群环境配置本地启动集群启动向集群提交作业部署模式 会话模式(SessionMode)单作业模式应用模式(ApplicationMode)独立模式会话模式部署单作业模式部署应用模式部署高可用(HighAvailability)YARN模式相关准备和配置会话模式部署单作业模式部署应用模式部署高可用快速启动一个Flink集群环境配置准备三台Linux机器,要求如下:1.CentOS7.52.安装java83.安装Hadoop集群,建议选择Hadoop2.7.5以上版本4.配置集群节点服务器免密登录,关闭防火墙本地启动1.下载安装包进入Flink官网,下载1.13.0版本安

flink主要组件及高可用配置

背景flink不论运行在哪种环境,例如Yarn,Mesos,Kebernute以及独立集群,每个应用都会包含重要的几个组件,本文就来讲述下flink的主要组件以及如何实现flink的高可用配置flink主要组件如图所示,flink主要由Dispatcher,JobManager,ResourceManager,TaskManager是个组件组成,以下我们大概说一下他们的主要用途:Dispatcher:主要用于接收提交过来的应用程序Jar包,随后Dispatcher就会启动应用的JobManager开始启动flink引用,备注:在Yarn中,Dispatcher这个角色的工作由ResourceM

Flink处理函数(一)

目录 7.1基本处理函数(ProcessFunction)7.1.1处理函数的功能和使用7.1.2ProcessFunction解析7.1.3处理函数的分类7.2按键分区处理函数(KeyedProcessFunction)7.2.1定时器(Timer)和定时服务(TimerService)7.2.2KeyedProcessFunction的使用7.3窗口处理函数7.3.1窗口处理函数的使用7.3.2ProcessWindowFunction解析7.4应用案例——TopN7.4.1使用ProcessAllWindowFunction7.4.2使用KeyedProcessFunction之前所介绍

flink-安装以及可视化界面的简单使用

简易安装Flinkflink的运行需要依赖JDK的环境,所以无论以何种方式安装flink,首先要确保环境中的JDK能正常使用说明:此笔记中的所有内容都是以Linux系统进行演示一、基于Flink包进行安装1、安装openJDK#下载$aptinstallopenjdk-11-jdk#配置全局环境$gedit~/.bashrc#将配置写入配置文件中exportJAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64exportJRE_HOME=${JAVA_HOME}/jreexportCLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME

Flink批处理metaspace内存溢出问题

问题早上过来发现定时任务出现告警,FlinkJobs运行失败,登录Flinkweb后台一看,所有jobs都没了,slot也为0。查看Flink日志,有以下错误异常:2022-12-0708:00:05,444ERRORorg.apache.flink.runtime.taskexecutor.TaskManagerRunner[]-FatalerroroccurredwhileexecutingtheTaskManager.Shuttingitdown...java.lang.OutOfMemoryError:Metaspace.Themetaspaceout-of-memoryerrorha

美团买菜基于 Flink 的实时数仓建设

美团买菜基于Flink的实时数仓建设1.背景介绍2.技术愿景和架构设计3.典型场景、挑战与应对3.1动态ETA实时特征3.2实时数据经营分析4.未来规划1.背景介绍美团买菜是美团自营生鲜零售平台,上面所有的商品都由美团亲自采购,并通过供应链物流体系,运输到距离用户3km范围内的服务站。用户从美团买菜平台下单后,商品会从服务站送到用户手中,最快30分钟内。上图中,左侧的时间轴展示了美团买菜的发展历程,右侧展示了美团买菜丰富的商品。目前,美团买菜在北上广深、武汉等城市均有业务覆盖,为人们日常的生活提供便利。在疫情场景下,起到了非常重要的保障民生作用。接下来,介绍一下实时数仓场景。美团买菜的实时数仓

Flink SQL 解析嵌套的 JSON 数据

下面将会演示如何在DDL里面定义Map、Array、Row类型的数据,以及在SQL里面如何获里面的值。数据格式如下:{"funcName":"test","data":{"snapshots":[{"content_type":"application/x-gzip-compressed-jpeg","url":"https://blog.csdn.net/xianpanjia4616"}],"audio":[{"content_type":"audio/wav","url":"https://bss.csdn.net/m/topic/blog_star2020/detail?username

一年省七位数,得物自建HFDS在 Flink Checkpoint 场景下的应用实践

1、背景随着阿里云Flink实例的迁移下云以及新增需求接入,自建Flink平台规模逐渐壮大,当前总计已超4万核运行在自建的K8S集群中,然而Flink任务数的增加,特别是大状态任务,每次Checkpoint时会产生脉冲式带宽占用,峰值流量超过100Gb/s,早期使用阿里云OSS作为Checkpoint数据存储,单个Bucket每1P数据量只有免费带宽10Gb/s,超出部分单独计费,当前规模每月需要增加1xw+/月。为了控制这部分成本,得物开展了自建HDFS在FlinkCheckpoint场景下的落地工作,实现年度成本节省xxx万元。此次分享自建HDFS在实时计算checkpoint场景的实践经

Flink 消费Kafka每日不定时积压(非重启不能解决)问题排查解决

1.背景        接手了一个问题排查的工作,有个Flink任务每天不定时会出现数据积压,无论是白天还是数据量很少的夜里,且积压的数据量会越来越多,得不到缓解,只能每日在积压告警后重启,重启之后消费能力一点毛病没有,积压迅速缓解,然而,问题会周而复始的出现,无论是周末还是节假日,忍不了2.现象    1.当积压时,最明显的是kafka积压不断升高     2.FlinkProcessFunction(主要处理逻辑)中多个代码块处理时间变长    为了定位问题,在processFunction多个代码块加了处理时间的计算,结果发现,无论是简单的json处理部分还是与外部Redis,Mysql

【Flink系列】查看Flink版本的命令,常用命令

 1.如何查看安装的Flink的版本?使用cd命令,进入Flink的安装目录的bin目录下,执行一下命令: ./flink  -v2.查看Flink运行的job情况也是在安装目录bin目录下,执行命令: ./flink  list 20220411补充:3.Flink停止/启动操作进入flink的安装目录:./bin/stop-cluster.sh       ##停止./bin/start-cluster.sh       ##启动后续更新 。。。。