草庐IT

五种加速云数据仓库迁移的方法

机房360 2023-03-28 原文
行业专家已经进行了研究,评估了各种云数据仓库(CDW)选项,在整个组织中获得了正确的买进和批准,并准备在Snowflake、Redshift、DeltaLake或其他云数据仓库(CDW)上继续前进。新的商业智能(BI)、分析和机器学习机会现在清晰可见。云数据仓库(CDW)与它们的内部部署前辈相比,在速度、效率和成本方面具有优势。但前方仍有艰苦的工作要做,你们现在所做的选择可能意味着数日、数月或数年之后你们将取得成功。

尽管提取、转换和加载(ETL)的世界已经从其内部部署的根源发展起来,但构建和管理将向数据消费者交付分析就绪数据的数据管道仍然是非常资源密集型的。以下是减少这些资源需求并缩短成功发行云数据仓库(CDW)的时间的五种方法。

1.为任何数据源查找连接器

您可能有一个深厚而强大的数据工程师团队,他们过去曾为源代码集成编写过代码。他们甚至可能喜欢这项工作,尽管大多数人都很乐意离开这项乏味的工作。无论如何,这是加速数据仓库迁移的最大机会之一。在您之前,许多团队都需要数据库、文件、应用程序或事件流的连接器。有各种可用的预构建连接器工具,涵盖了大多数组织的大部分数据源。当然,也可能有一些您的行业甚至企业所独有的数据源。但是,就像使用预构建的连接器一样,将受益于具有框架的供应商的经验以及处理自定义源的特定经验。

2.自动化基础设施

通过迁移到云,您已经离开了在数据中心管理物理服务器的世界,但如果不小心,您仍然可能会让基础设施工作压倒您的团队。管理数据的重复移动和准备需要调度任务及其依赖关系、配置计算集群、优化成本和性能等等。有不同的选项可以减轻您的团队的工程时间,从开源编排器和无服务器选项到完全管理的管道工具。

3.民主化数据生产

通常认为数据民主化主要是一个成功的云数据仓库(CDW)项目的结果。为更多的数据消费者提供仪表板和数据集当然是数据素养组织的关键。让数据的生产者——那些最熟悉数据的含义和历史的人——能够获得数据也很重要。如果没有这一点,就需要一个中央团队负责选择数据,并将具有意义和价值的数据交付给数据消费者。他们要么花费无数小时研究每个域和数据源,要么最终生成用户无法理解和不信任的云数据仓库(CDW)。更好的方法是为领域专家提供无代码工具,直接构建管道并为分析准备数据。

4.不要忽略排除故障的时间

当您计划迁移到云数据仓库(CDW)时,很容易将所有注意力集中在启动云数据仓库(CDW)所需的数据工程工作上。然而,企业的数据工程师可能经常花费和其他事情一样多的时间进行故障排除。有用于监视的工具,您可以编写用于错误警报的代码。更有效的是完全管理的管道产品,它提供开箱即用的这些功能,并可以在问题到达您的团队之前解决问题。所有这五个技巧将增加您的云数据仓库(CDW)的正常运行时间,这是您的数据工程师的最终时间缓解。这也是实现价值的关键,这取决于你的数据消费者的信任和采用。

5.期待意外

在这一点上,可能会认为自动化已经解决了所有问题,工具的生态系统已经涵盖了所有可以想象到的情况。现实是没有一个简单的按钮,您应该警惕黑盒解决方案,建议管道可以100%自动化。数据源和目标将会改变。您可能决定集成业务目录或数据质量工作流等功能。确保您已经投资了具有灵活性的工具或服务,以处理您独特且不断变化的环境。通过严格的自动化,可以节省数百个小时,但是当他们需要解决边缘情况时,可以节省这些时间。

有关五种加速云数据仓库迁移的方法的更多相关文章

  1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

    我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

  2. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

    总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

  3. ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法? - 2

    类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc

  4. ruby - Facter::Util::Uptime:Module 的未定义方法 get_uptime (NoMethodError) - 2

    我正在尝试设置一个puppet节点,但ruby​​gems似乎不正常。如果我通过它自己的二进制文件(/usr/lib/ruby/gems/1.8/gems/facter-1.5.8/bin/facter)在cli上运行facter,它工作正常,但如果我通过由ruby​​gems(/usr/bin/facter)安装的二进制文件,它抛出:/usr/lib/ruby/1.8/facter/uptime.rb:11:undefinedmethod`get_uptime'forFacter::Util::Uptime:Module(NoMethodError)from/usr/lib/ruby

  5. ruby-on-rails - Ruby on Rails 迁移,将表更改为 MyISAM - 2

    如何正确创建Rails迁移,以便将表更改为MySQL中的MyISAM?目前是InnoDB。运行原始执行语句会更改表,但它不会更新db/schema.rb,因此当在测试环境中重新创建表时,它会返回到InnoDB并且我的全文搜索失败。我如何着手更改/添加迁移,以便将现有表修改为MyISAM并更新schema.rb,以便我的数据库和相应的测试数据库得到相应更新? 最佳答案 我没有找到执行此操作的好方法。您可以像有人建议的那样更改您的schema.rb,然后运行:rakedb:schema:load,但是,这将覆盖您的数据。我的做法是(假设

  6. Ruby 方法() 方法 - 2

    我想了解Ruby方法methods()是如何工作的。我尝试使用“ruby方法”在Google上搜索,但这不是我需要的。我也看过ruby​​-doc.org,但我没有找到这种方法。你能详细解释一下它是如何工作的或者给我一个链接吗?更新我用methods()方法做了实验,得到了这样的结果:'labrat'代码classFirstdeffirst_instance_mymethodenddefself.first_class_mymethodendendclassSecond使用类#returnsavailablemethodslistforclassandancestorsputsSeco

  7. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  8. ruby - 使用 Vim Rails,您可以创建一个新的迁移文件并一次性打开它吗? - 2

    使用带有Rails插件的vim,您可以创建一个迁移文件,然后一次性打开该文件吗?textmate也可以这样吗? 最佳答案 你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件,这正是您想要的。我不能代表textmate。 关于ruby-使用VimRails,您可以创建一个新的迁移文件并一次性打开它吗?,我们在StackOverflow上找到一个类似的问题: https://sta

  9. ruby-on-rails - Rails 3.2.1 中 ActionMailer 中的未定义方法 'default_content_type=' - 2

    我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他,以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时,出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer

  10. ruby - Highline 询问方法不会使用同一行 - 2

    设置:狂欢ruby1.9.2高线(1.6.13)描述:我已经相当习惯在其他一些项目中使用highline,但已经有几个月没有使用它了。现在,在Ruby1.9.2上全新安装时,它似乎不允许在同一行回答提示。所以以前我会看到类似的东西:require"highline/import"ask"Whatisyourfavoritecolor?"并得到:Whatisyourfavoritecolor?|现在我看到类似的东西:Whatisyourfavoritecolor?|竖线(|)符号是我的终端光标。知道为什么会发生这种变化吗? 最佳答案

随机推荐