草庐IT

官宣!Taier1.3新版本正式发布,新鲜功能抢先体验

2022年11月7日,Taier1.3版本正式发布!Taier是一个大数据分布式可视化的DAG任务调度系统,旨在降低ETL开发成本、提高大数据平台稳定性,大数据开发人员可以在Taier直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工作的重心更多地聚焦在业务之中。Taier自今年2月份开源之后,得到了社区开发者的广泛支持,我们积极吸收社区开发者的意见建议,不断迭代版本,目前已发布了Taier1.1、Taier1.2这两个大的版本更新。本次发布的Taier1.3版本,我们新增了FlinkStandalone组件,融合了DataSourceX的模块,并新增了

DAG任务调度系统 Taier 演进之道,探究DataSourceX 模块

熟悉Taier的小伙伴们应该都知道,在11月7日发布的Taier1.3新版本中,我们融合了「DataSourceX模块」。这是十分重要的一个变化,移除Taier外部插件依赖,新增数据源插件相关特性,支持后续Taier对接更多的RDBMS类型的SQL任务。本篇文章,就带大家详细了解一下DataSourceX的作用及设计。DataSourceX模块的作用为什么说DataSourceX是一个非常重要的模块?在Taier中RDBSQL任务的运行,向导模式的数据同步、实时采集、FlinkSQL任务配置都是依托数据源来进行的,其中保证数据源的正常使用以及RDBSQL运行、任务所需的库、表、字段等信息的获取

DAG任务调度系统 Taier 演进之道,探究DataSourceX 模块

熟悉Taier的小伙伴们应该都知道,在11月7日发布的Taier1.3新版本中,我们融合了「DataSourceX模块」。这是十分重要的一个变化,移除Taier外部插件依赖,新增数据源插件相关特性,支持后续Taier对接更多的RDBMS类型的SQL任务。本篇文章,就带大家详细了解一下DataSourceX的作用及设计。DataSourceX模块的作用为什么说DataSourceX是一个非常重要的模块?在Taier中RDBSQL任务的运行,向导模式的数据同步、实时采集、FlinkSQL任务配置都是依托数据源来进行的,其中保证数据源的正常使用以及RDBSQL运行、任务所需的库、表、字段等信息的获取

一看就懂!任务提交的资源判断在Taier中的实践

Taier介绍Taier是袋鼠云开源项目之一,是一个分布式可视化的DAG任务调度系统。旨在降低ETL开发成本、提高大数据平台稳定性,大数据开发人员可以在Taier直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工作的重心更多地聚焦在业务之中。项目地址:https://github.com/DTStack/TaierTaier资源判断Taier基于插件式架构设计,用户在界面开发任务并提交运行。提交运行插件又划分为worker-plugins、datasource-plugins双插件类型。在任务提交的时候,Taier需要判断是否有足够的资源来执行,否则一股

一看就懂!任务提交的资源判断在Taier中的实践

Taier介绍Taier是袋鼠云开源项目之一,是一个分布式可视化的DAG任务调度系统。旨在降低ETL开发成本、提高大数据平台稳定性,大数据开发人员可以在Taier直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工作的重心更多地聚焦在业务之中。项目地址:https://github.com/DTStack/TaierTaier资源判断Taier基于插件式架构设计,用户在界面开发任务并提交运行。提交运行插件又划分为worker-plugins、datasource-plugins双插件类型。在任务提交的时候,Taier需要判断是否有足够的资源来执行,否则一股

开源交流丨任务or实例 详解大数据DAG调度系统Taier任务调度

课件获取:关注公众号“数栈研习社”,后台私信“Taier”获得直播课件视频回放:点击这里ChunJun开源项目地址:github丨gitee喜欢我们的项目给我们点个__STAR!STAR!!STAR!!!(重要的事情说三遍)__技术交流钉钉qun:30537511前言在分享之前,先为大家介绍一下任务和实例的关系。任务指的是我们在任务开发界面上去创建的任务,比如Spark任务、SparkSQL任务、数据同步任务等,这些任务在开发过程中是静态的脚本,当被提交到计算节点去执行时,被执行的过程我们把它抽象成实例。举一个简单的例子来说明:比如我们写完一个Java的类然后把它打包成Jar包,其实这个Jar

开源交流丨任务or实例 详解大数据DAG调度系统Taier任务调度

课件获取:关注公众号“数栈研习社”,后台私信“Taier”获得直播课件视频回放:点击这里ChunJun开源项目地址:github丨gitee喜欢我们的项目给我们点个__STAR!STAR!!STAR!!!(重要的事情说三遍)__技术交流钉钉qun:30537511前言在分享之前,先为大家介绍一下任务和实例的关系。任务指的是我们在任务开发界面上去创建的任务,比如Spark任务、SparkSQL任务、数据同步任务等,这些任务在开发过程中是静态的脚本,当被提交到计算节点去执行时,被执行的过程我们把它抽象成实例。举一个简单的例子来说明:比如我们写完一个Java的类然后把它打包成Jar包,其实这个Jar

深入理解 Taier:MR on Yarn 的实现原理

我们今天常说的大数据技术,它的理论基础来自于2003年Google发表的三篇论文,《TheGoogleFileSystem》、《MapReduce:SimplifiedDataProcessingonLargeClusters》、《Bigtable:ADistributedStorageSystemforStructuredData》。这三篇论文分别对应后来出现的HDFS,MapReduce,HBase。在大数据的发展历史上,还有一个名字是无论如何都绕不开的,那就是DougCutting。Doug是ApacheLucene、Nutch、Hadoop、Avro项目的创始人,2006年DocuCu

深入理解 Taier:MR on Yarn 的实现原理

我们今天常说的大数据技术,它的理论基础来自于2003年Google发表的三篇论文,《TheGoogleFileSystem》、《MapReduce:SimplifiedDataProcessingonLargeClusters》、《Bigtable:ADistributedStorageSystemforStructuredData》。这三篇论文分别对应后来出现的HDFS,MapReduce,HBase。在大数据的发展历史上,还有一个名字是无论如何都绕不开的,那就是DougCutting。Doug是ApacheLucene、Nutch、Hadoop、Avro项目的创始人,2006年DocuCu

基于开源大数据调度系统Taier的Web前端架构选型及技术实践

原文链接:基于开源大数据调度系统Taier的Web前端架构选型及技术实践课件获取:关注公众号“数栈研习社”,后台私信“Taier”获得直播课件视频回放:点击这里Taier开源项目地址:github丨gitee上两期,我们为大家分享了Taier入门及控制台的介绍,本期我们为大家分享Taier的Web前端架构介绍。本次分享我们将从Taier的前端技术栈选型,到技术实现以及未来规划为大家讲解。一、Taier的Web前端技术栈介绍首先我们来为大家介绍Taier的Web前端架构图,如下图所示:file我们的项目以UmiJS作为底层脚手架,在此基础上,引入TailwindCSS、Sass、React三个插