Flink开发利器StreamX

StreamX 2023-03-28 原文

Hadoop体系虽然在目前应用非常广泛，但架构繁琐、运维复杂度过高、版本升级困难，且由于部门原因，数据中台需求排期较长，我们急需探索敏捷性开发的数据平台模式。在目前云原生架构的普及和湖仓一体化的大背景下，我们已经确定了将Doris作为离线数据仓库，将TiDB(目前>已经应用于生产)作为实时数据平台，同时因为Doris具有 on MySQL 的odbc能力，所以又可以>对外部数据库资源进行整合，统一对外输出报表

这里借用一下Doris官方的架构图

遇到的问题
在数据引擎上，我们确定使用Spark和Flink

使用Spark on K8s client 客户端模式做离线数据处理
使用Flink on K8s Native-Application/Session 模式做实时任务流管理

在这里，实际上有一些问题我们一直没有彻底解决。用过Native-Application模式的朋友都知道，每提交一个任务，都需要打包新的镜像，提交到私有仓库，然后再调用Flink Run 指令沟通K8s,去拉取镜像运行Pod。任务提交之后，还需要去K8s查看log, 但是:

任务运行监控怎么处理？
使用Cluster模式还是Nodeport暴露端口访问Web UI？
提交任务能否简化打包镜像的流程?
如何减少开发压力？
......

解决问题的过程

以上的这些其实都是需要解决的问题，如果单纯的使用命令行去提交每个任务，是不现实的，任务量大了，会变得不可维护。如何解决这些问题变成一个不得不面对的问题。

简化镜像构建

首先，针对Flink原生镜像需要二次build的问题：我们利用了MINIO作为外部存储，并使用s3-fuse通过DaemonSet的方式直接挂载在了每个宿主节点上，我们所需要提交的jar包都可以放到上面统一管理，这样的话，即使扩缩容Flink节点，也能实现s3挂载自动伸缩。

image.png

Flink从1.13版本开始，就支持Pod Template，我们可以在Pod Template中利用数据卷挂载的方式再将宿主机目录挂载到每个pod中。从而无需镜像打包而直接在K8s上运行Flink程序。如上图，我们将s3先通过s3-fuse Pod挂载在Node1、Node2的/mnt/data-s3fs目录下，然后再将/mnt/data-s3fs挂载到Pod A中。

但是，因为对象存储随机写入或追加文件需要重写整个对象，导致这种方式仅适合于频繁读。而这刚好满足我们现在的场景。

引入低代码平台StreamX

之前我们写Flink Sql 基本上都是使用Java包装Sql，打jar包，提交到s3平台上，通过命令行方式提交代码，但这种方式始终不友好，流程繁琐，开发和运维成本太大。我们希望能够进一步简化流程，将Flink TableEnvironment 抽象出来，有平台负责初始化、打包运行Flink任务，实现Flink应用程序的构建、测试和部署自动化。

这是个开源兴起的时代，我们自然而然的将目光投向开源领域中，在一众开源项目中,经过对比各个项目综合评估发现Zeppelin和StreamX这两个项目对Flink的支持较为完善，都宣称支持Flink on K8s，最终进入到我们的目标选择范围中，以下是两者在K8s相关支持的简单比较（目前如果有更新，麻烦批评指正）。

PS: 此处仅从调研用户角度出发，我们对双方开发都保持极大的尊重

调研过程中,我们与两者的主开发人员都进行了多次沟通。经过我们反复研究之后，还是决定将StreamX作为我们目前的Flink开发工具来使用。

经过开发同学长时间开发测试，StreamX目前已经具备:

完善的Sql校验功能
实现了自动build/push镜像
使用自定义类加载器,通过Child-first 加载方式解决了YARN和K8s两种运行模式、支持了自由切换Flink多版本
与Flink-Kubernetes进行深度整合，提交任务后返回WebUI，通过remote rest api + remote K8s ，追踪任务执行状态
同时支持了Flink1.12、1.13、1.14等版本

以上基本解决了我们目前开发和运维中存在的大部分问题。

在目前最新发布的1.2.0版本中，StreamX较为完善的支持了K8s-Native-Application和K8s-session-Application模式。

K8s Native Application 模式
在StreamX中，我们只需要配置相应的参数，并在Maven pom中填写相应的依赖，或者上传依赖jar包，点击Apply，相应的依赖就会生成。这就意味着我们也可以将所有使用的Udf打成jar包 and 各种 connector.jar，直接在sql中使用。如下图:

image.png

Sql校验能力和 Zeppelin基本一致:

image.png

我们也可以指定资源，指定Flink Run中的动态参数Dynamic Option，甚至参数可以整合pod template

image.png

程序保存后，点击运行时，也可以指定savepoint。任务提交成功后，StreamX会根据FlinkPod网络Exposed Type(loadBalancer/Nodeport/ClusterIp),返回相应的WebURL，从而自然的实现WebUI跳转,但是目前因为线上私有K8s集群出于安全性考虑,尚未打通Pod与客户端节点网络（目前也没有这个规划），所以我们只使用Nodeport。如果后续任务数过多，有使用ClusterIP的需求的话，我们可能会将StreamX 部署在K8s，或者同ingress做进一步整合。

image.png

注意：K8s master 如果使用vip做均衡代理的情况下，Flink 1.13版本会返回vip的ip地址，1.14版本已经修复。

下面是K8s Application模式下具体提交流程

以上是依据个人理解绘制的任务提交流程图,如有错误,敬请谅解

K8s Native Session 模式
StreamX还较好的支持了K8s Native-Sesson模式，这为我们后续做离线FlinkSql开发或部分资源隔离做了较好的技术支持。

Native-session模式需要事先使用Flink命令创建一个运行在K8s中的Flink集群,如下:

./kubernetes-session.sh \
-Dkubernetes.cluster-id=flink-on-k8s-flinkSql-test \
-Dkubernetes.context=XXX \
-Dkubernetes.namespace=XXXX \
-Dkubernetes.service-account=XXXX \
-Dkubernetes.container.image=XXXX \
-Dkubernetes.container.image.pull-policy=Always \
-Dkubernetes.taskmanager.node-selector=XXXX \
-Dkubernetes.rest-service.exposed.type=Nodeport

image.png

如上图，使用该ClusterId作为StreamX的任务参数Kubernetes ClusterId。保存提交任务后，任务会很快处于Running状态

image.png

我们顺着application info的WebUI点击跳转

image.png

可以看到，其实StreamX是将jar包通过Rest Api上传到Flink集群上，并调度执行任务的。

Custom Code模式
另我们惊喜的是，StreamX 还支持代码编写DataStream/FlinkSql任务。对于特殊需求，我们可以自己写Java/Scala实现。可以根据StreamX推荐的脚手架方式编写任务，也可以编写一个标准普通的Flink任务，通过这种方式我们可以将代码管理交由Git实现，平台可以用来自动化编译打包与部署。当然，如果能用Sql实现的功能，我们会尽量避免自定义DataStream，减少不必要的运维麻烦。

意见和规划
改进意见

当然StreamX还有很多需要改进的地方，就目前测试来看：

资源管理还有待加强

多文件系统jar包等资源管理功能尚未添加，任务版本功能有待加强。

前端buttern 功能还不够丰富

比如任务添加后续可以增加复制等功能按钮。

任务提交日志也需要可视化展示

任务提交伴随着加载class文件，打jar包，build镜像，提交镜像，提交任务等过程，每一个环节出错，都会导致任务的失败，但是失败日志往往不明确，或者因为某种原因导致异常未正常抛出，没有转换任务状态，用户会无从下手改进。

众所周知，一个新事物的出现一开始总会不是那么完美。尽管有些许问题和需要改进的point，但是瑕不掩瑜，我们仍然选择StreamX作为我们的Flink DevOps，我们也将会和主开发人员一道共同完善StreamX，也欢迎更多的人来使用，为StreamX带来更多进步。

未来规划

我们会继续跟进doris，并将业务数据 + 日志数据统一入doris，通过Flink实现湖仓一体；
我们也会逐步将探索StreamX同dolphinscheduler 2.x进行整合，完善dolphinscheduler离线任务，逐步用Flink 替换掉Spark，实现真正的流批一体；
基于我们自身在s3上的探索积累，fat-jar包 build 完成之后不再构建镜像，直接利用Pod Tempelet挂载pvc到Flink pod中的目录，进一步优化代码提交流程；
将StreamX持续应用到我们生产中，并汇同社区开发人员，共同努力，增强StreamX在Flink流上的开发部署能力与运行监控能力，努力把StreamX打造成一个功能完善的流数据 DevOps。

附:

Streamx 官网: http://streamxhub.com

Streamx Github: https://github.com/streamxhub/streamx

AWS s3挂载到K8s: https://zhuanlan.zhihu.com/p/372250644

Doris Github: https://github.com/apache/incubator-doris

image.png

有关Flink开发利器StreamX的更多相关文章

ruby - 使用 C 扩展开发 rubygem 时，如何使用 Rspec 在本地进行测试？ - 2
我正在编写一个包含C扩展的gem。通常当我写一个gem时，我会遵循TDD的过程，我会写一个失败的规范，然后处理代码直到它通过，等等......在“ext/mygem/mygem.c”中我的C扩展和在gemspec的“扩展”中配置的有效extconf.rb，如何运行我的规范并仍然加载我的C扩展？当我更改C代码时，我需要采取哪些步骤来重新编译代码？这可能是个愚蠢的问题，但是从我的gem的开发源代码树中输入“bundleinstall”不会构建任何native扩展。当我手动运行rubyext/mygem/extconf.rb时，我确实得到了一个Makefile(在整个项目的根目录中)，然后当
Ruby Sinatra 配置用于生产和开发 - 2
我已经在Sinatra上创建了应用程序，它代表了一个简单的API。我想在生产和开发上进行部署。我想在部署时选择，是开发还是生产，一些方法的逻辑应该改变，这取决于部署类型。是否有任何想法，如何完成以及解决此问题的一些示例。例子:我有代码get'/api/test'doreturn"Itisdev"end但是在部署到生产环境之后我想在运行/api/test之后看到ItisPROD如何实现？最佳答案根据SinatraDocumentation:EnvironmentscanbesetthroughtheRACK_ENVenvironm
ruby - 是否可以覆盖 gemfile 进行本地开发？ - 2
我们的git存储库中目前有一个Gemfile。但是，有一个gem我只在我的环境中本地使用(我的团队不使用它)。为了使用它，我必须将它添加到我们的Gemfile中，但每次我checkout到我们的master/dev主分支时，由于与跟踪的gemfile冲突，我必须删除它。我想要的是类似Gemfile.local的东西，它将继承从Gemfile导入的gems，但也允许在那里导入新的gems以供使用只有我的机器。此文件将在.gitignore中被忽略。这可能吗？最佳答案设置BUNDLE_GEMFILE环境变量:BUNDLE_GEMFI
ruby - 在 Windows 机器上使用 Ruby 进行开发是否会适得其反？ - 2
这似乎非常适得其反，因为太多的gem会在window上破裂。我一直在处理很多mysql和ruby-mysqlgem问题(gem本身发生段错误，一个名为UnixSocket的类显然在Windows机器上不能正常工作，等等)。我只是在浪费时间吗？我应该转向不同的脚本语言吗？最佳答案我在Windows上使用Ruby的经验很少，但是当我开始使用Ruby时，我是在Windows上，我的总体印象是它不是Windows原生系统。因此，在主要使用Windows多年之后，开始使用Ruby促使我切换回原来的系统Unix，这次是Linux。Rub
ruby-on-rails - 在 Rails 开发环境中为 .ogv 文件设置 Mime 类型 - 2
我正在玩HTML5视频并且在ERB中有以下片段:mp4视频从在我的开发环境中运行的服务器很好地流式传输到chrome。然而firefox显示带有海报图像的视频播放器，但带有一个大X。问题似乎是mongrel不确定ogv扩展的mime类型，并且只返回text/plain，如curl所示:$curl-Ihttp://0.0.0.0:3000/pr6.ogvHTTP/1.1200OKConnection:closeDate:Mon,19Apr201012:33:50GMTLast-Modified:Sun,18Apr201012:46:07GMTContent-Type:text/plain
世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2
无论您是想搭建桌面端、WEB端或者移动端APP应用，HOOPSPlatform组件都可以为您提供弹性的3D集成架构，同时，由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台（桌面/WEB/APP，而且某些客户端是“瘦”客户端）快速、方便地将数据接入到3D应用系统的解决方案，并且当访问数据时，在各个平台上的性能和用户体验保持一致，HOOPSPlatform将帮助您完成。利用HOOPSPlatform，您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品，HOOPSSDK包含的技术有：快速且准确的CAD
【鸿蒙应用开发系列】- 获取系统设备信息以及版本API兼容调用方式 - 2
在应用开发中，有时候我们需要获取系统的设备信息，用于数据上报和行为分析。那在鸿蒙系统中，我们应该怎么去获取设备的系统信息呢，比如说获取手机的系统版本号、手机的制造商、手机型号等数据。1、获取方式这里分为两种情况，一种是设备信息的获取，一种是系统信息的获取。1.1、获取设备信息获取设备信息，鸿蒙的SDK包为我们提供了DeviceInfo类，通过该类的一些静态方法，可以获取设备信息，DeviceInfo类的包路径为：ohos.system.DeviceInfo.具体的方法如下：ModifierandTypeMethodDescriptionstatic StringgetAbiList()Obt
微信小程序开发入门与实战（Behaviors使用） - 2
@作者:SYFStrive @博客首页:HomePage📜：微信小程序📌：个人社区（欢迎大佬们加入）👉：社区链接🔗📌：觉得文章不错可以点点关注👉：专栏连接🔗💃：感谢支持,学累了可以先看小段由小胖给大家带来的街舞👉微信小程序（🔥）目录自定义组件-behaviors 1、什么是behaviors 2、behaviors的工作方式 3、创建behavior 4、导入并使用behavior 5、behavior中所有可用的节点 6、同名字段的覆盖和组合规则总结最后自定义组件-behaviors 1、什么是behaviorsbehaviors是小程序中，用于实现
ruby-on-rails - environment.rb 中设置的常量在开发模式中消失 - 2
了解Rails缓存如何工作的人可以真正帮助我。这是嵌套在Rails::Initializer.runblock中的代码:config.after_initializedoSomeClass.const_set'SOME_CONST','SOME_VAL'end现在，如果我运行script/server并发出请求，一切都很好。然而，在我的Rails应用程序的第二个请求中，一切都因单元化常量错误而变得糟糕。在生产模式下，我可以成功发出第二个请求，这意味着常量仍然存在。我已通过将以上内容更改为以下内容来解决问题:config.after_initializedorequire'some_cl
ruby - Rails 开发服务器、PDFKit 和多线程 - 2
我有一个使用PDFKit呈现网页的pdf版本的Rails应用程序。我使用Thin作为开发服务器。问题是当我处于开发模式时。当我使用“bundleexecrailss”启动我的服务器并尝试呈现任何PDF时，整个过程会陷入僵局，因为当您呈现PDF时，会向服务器请求一些额外的资源，如图像和css，看起来只有一个线程.如何配置Rails开发服务器以运行多个工作线程？非常感谢。最佳答案我找到的最简单的解决方案是unicorn.geminstallunicorn创建一个unicorn.conf:worker_processes3然后使用它:

Flink开发利器StreamX

解决问题的过程

简化镜像构建

引入低代码平台StreamX

有关Flink开发利器StreamX的更多相关文章

随机推荐