草庐IT

ETLCloud

全部标签

ETLCloud+MaxCompute实现云数据仓库的高效实时同步

MaxCompute介绍MaxCompute是适用于数据分析场景的企业级SaaS(SoftwareasaService)模式云数据仓库,以Serverless架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效地分析处理海量数据。MaxCompute提供离线和流式数据的接入,支持大规模数据计算及查询加速能力,为您提供面向多种计算场景的数据仓库解决方案及分析建模服务。MaxCompute适用于100GB以上规模的存储及计算需求,最大可达EB级别,并且MaxCompute已经在阿里巴巴集团内部得到大规模应用。MaxCompu

新一代数据集成工具ETLCloud入门实践:实现MySQL到ClickHouse的快速迁移

背景大数据(BigData)最重要的是数据,没有数据其他的就无从谈起(如今GPT大热,也是得益于海量数据的采集、存储、计算及治理能力的提升)。大数据项目开发的首要任务就是采集海量数据,这就要求我们具备海量数据采集的能力。在实际工作中,数据一般有两种来源,一种来自日志文件,一种来自数据库。每种数据源的采集技术有很多种,一般使用Flume、Logstash、Filebeat等工具采集日志文件数据,使用Sqoop、Canal、DataX等工具采集数据库中的数据。然而,前面提到的这些数据采集或集成工具,基本是面向开发者的,要求使用者具备较高的技术能力,使用时我们开发者面对的一般都是命令行、配置文件、接