草庐IT

flink集群

全部标签

DR-AUTO-SYNC架构集群搭建及主备切换手册

作者:Liuhaoao原文来源:https://tidb.net/blog/170d6d47近期有个生产系统,计划做一套dr-autosync的集群,但是之前并没有这种类型系统的生产实施经验,就一点点的摸索,好在最后是顺利搭建成功了,把搭建过程分享出来给大家参考下。1、集群架构2、规划拓扑根据集群架构规划拓扑文件global:user:"tidb"ssh_port:22deploy_dir:"/tidb/tidb-deploy"data_dir:"/tidb/tidb-data"arch:"arm64"monitored:node_exporter_port:19100blackbox_exp

[Kubernetes]7. K8s包管理工具Helm、使用Helm部署mongodb集群(主从数据库集群)

上一节讲解了[Kubernetes]6.k8sPod配置管理ConfigMap&Secret以及传递环境变量的使用,k8s的命名空间以及使用kubens管理命名空间的使用,这里来介绍一下Helm的使用一.Helm相关介绍 1.介绍在kubernetes系统上部署容器化应用时需要事先手动编写资源配置清单文件以定义资源对象,而且其每一次的配置定义基本上都是硬编码,基本上无法实现复用.对于较大规模的应用场景,应用程序的配置,分发,版本控制,查找,回滚甚至是查看都将是用户的噩梦,而Helm可大大简化应用管理的难度,Helm类似npm,pip,dockerhub,可以理解为是一个软件库,它是Kubern

【Flink入门修炼】2-2 Flink State 状态

什么是状态?状态有什么作用?如果你来设计,对于一个流式服务,如何根据不断输入的数据计算呢?又如何做故障恢复呢?一、为什么要管理状态流计算不像批计算,数据是持续流入的,而不是一个确定的数据集。在进行计算的时候,不可能把之前已经输入的数据全都保存下来,然后再和新数据合并计算。效率低下不说,内存也扛不住。另外,如果程序出现故障重启,没有之前计算过的状态保存,那么也就无法再继续计算了。因此,就需要一个东西来记录各个算子之前已经计算过值的结果,当有新数据来的时候,直接在这个结果上计算更新。这个就是状态。常见的流处理状态功能如下:数据流中的数据有重复,我们想对重复数据去重,需要记录哪些数据已经流入过应用,

部署 Docker Swarm 集群与可视化监控

目录1.基础环境1.1centos安装docker1.2ubuntu安装docker1.2.1准备1.2.2安装证书1.2.3写入软件源信息1.2.4安装1.2.5有问题执行此命令,再执行1.2.4安装1.2.6验证1.3swarm基础环境1.4修改主机名2.初始化docker-swarm管理节点2.1初始化2.2查看节点信息2.3查看网络信息2.4查看docker信息3.节点添加、删除、权限提升、降低3.1节点添加3.2节点权限提升降低3.2.1将node节点提升为master节点3.3将master节点降级为node节点3.4脱离集群4.安装图形监控界面4.1拉取visualizer镜像4

Flink 在蚂蚁实时特征平台的深度应用

摘要:本文整理自蚂蚁集团高级技术专家赵亮星云,在FlinkForwardAsia2023AI特征工程专场的分享。本篇内容主要分为以下四部分:蚂蚁特征平台特征实时计算特征Serving特征仿真回溯一、蚂蚁特征平台蚂蚁特征平台是一个多计算模式融合的高性能AI数据处理框架,能够满足AI训练和推理场景对特征低延迟产出、高并发访问以及在离线一致等方面的诉求。蚂蚁建设特征平台的核心目的,是让算法同学在数据供给侧能够自给自足,即data-self-sufficient。具体是希望算法同学通过平台以低代码的方式进行特征研发、测试、发布、上线,整个流程不需要专门数据工程团队支持对接。特征上线以后,背后对应的高性

Flink StreamGraph生成过程

文章目录概要SteramGraph核心对象SteramGraph生成过程概要在Flink中,StreamGraph是数据流的逻辑表示,它描述了如何在Flink作业中执行数据流转换。StreamGraph是Flink运行时生成执行计划的基础。使用DataStreamAPI开发的应用程序,首先被转换为Transformation,再被映射为StreamGraph,在客户端进行StreamGraph、JobGraph的转换,提交JobGraph到Flink集群后,Flink集群负责将JobGraph转换为ExecutionGraph,之后进入调度执行阶段。SteramGraph核心对象StreamN

【kubernetes】二进制部署k8s集群之,多master节点负载均衡以及高可用(下)

↑↑↑↑接上一篇继续部署↑↑↑↑之前已经完成了单master节点的部署,现在需要完成多master节点以及实现k8s集群的高可用一、完成master02节点的初始化操作二、在master01节点基础上,完成master02节点部署步骤一:准备好master节点所需要的文件etcd数据库所需要的ssl证书、master01节点的kubernetes安装目录(二进制文件、组件与apiserver通信的集群引导文件、启动参数配置文件)、kubectl与apiserver通信的集群引导文件、各组件被systemd管理的service文件##etcd目录只要ssl就可以,kubernetes安装目录传输

【大数据】Flink 内存管理(四):TaskManager 内存分配(实战篇)

《Flink内存管理》系列(已完结),共包含以下4篇文章:Flink内存管理(一):设置Flink进程内存Flink内存管理(二):JobManager内存分配(含实际计算案例)Flink内存管理(三):TaskManager内存分配(理论篇)Flink内存管理(四):TaskManager内存分配(实战篇)😊如果您觉得这篇文章有用✔️的话,请给博主一个一键三连🚀🚀🚀吧(点赞🧡、关注💛、收藏💚)!!!您的支持💖💖💖将激励🔥博主输出更多优质内容!!!Flink内存管理(四):TaskManager内存分配(实战篇)1.单独分配TotalProcessSize2.单独分配TotalFlinkSiz

Flink cdc debug调试动态变更表结构

文章目录前言调试流程1.拉取代码本地打包2.配置启动参数3.日志配置4.启动验证5.断点验证问题1.Cannotfindfactorywithidentifier"mysql"intheclasspath.2.JsonFactory异常3.NoSuchMethodError异常其他结尾前言接着上一篇Flinkcdc3.0动态变更表结构——源码解析,cdcdebug部分官方没有特别说明,尝试踩了一些坑,这里记录下。调试流程1.拉取代码本地打包通过github拉取3.0.0以上版本,本地maven打包mvncleanpackage-DskipTests2.配置启动参数搜索启动类CliFronten

【flink番外篇】15、Flink维表实战之6种实现方式-完整版(2)

Flink系列文章一、Flink专栏Flink专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、Flink部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink的基础部分,比如术语、架构、编程模型、编程指南、基本的datastreamapi用法、四大基石等内容。3、FlikTableAPI和SQL基础系列本部分介绍FlinkTableApi和SQL的基本用法,比如TableAPI和SQL创建库、表用法、查询、窗口函数、catalog等等内容。4、FlikTableAPI和SQL提高与应用系列本部分是tableapi和sql的应用部分,和实际的生产应