草庐IT

2023年及以后的七个大数据趋势预测

Petr Nemeth 2023-03-28 原文
​大数据初创厂商Dataddo公司首席执行官Petr Nemeth日前对全球2023年最重要的大数据发展趋势进行了预测。

与人们可能认为的相反,如今投资数字化转型的企业比例并不比新冠疫情发生之前高多少,处于数字化转型更高级阶段的企业所占的比例如今更高。

他们正在使用更多的数据生成工具,与更多的最终用户共享数据,并在管理数据方面做出更一致的努力。

这对有效的数据管理和商业智能的未来发展提出了许多问题。例如,是否需要更多的工具?如何确保他们生成的数据持续集成、共享和正确解释?将如何确保数据安全和干净?

以下是对2023年及以后的七个大数据趋势的预测,可以帮助商业领袖了解这些问题的答案。

对2023年大数据趋势的预测

(1)数据生成工具变得更加多样化,但每种工具的客户生命周期变得更短

毫无疑问,可用的SaaS工具的数量以及它们产生的数据量将会继续增长。预计2023年SaaS市场规模是2019年的两倍。企业每年都在采用越来越多的工具,而且没有看到结束的迹象。这样做的一个不太明显的副作用可能是缩短了这些工具的平均客户生命周期。

各种规模的企业每年在很少使用的工具方面浪费大量的费用。他们不断地尝试采用新的工具,但与此同时却忘记了其他工具。

此外,许多工具是在部门、团队和员工层面上采用的,导致大企业对其部署的SaaS工具的一半一无所知,小企业对大约三分之一的工具一无所知。

为了减少未使用工具的支出浪费,人们将看到IT部门加强整合和清理,这将缩短大多数SaaS工具的生命周期。

例外的是对企业基础设施至关重要的工具,例如CRM和数据集成工具 。

(2)数据集成变得与架构无关

如今,企业通常使用单独的平台进行ETL/ELT、反向ETL,有时还进行数据复制。

这是可以理解的,因为ETL/ELT和数据复制是数据集成世界中已经建立的流程,反向ETL是一个非常新的流程,只有少数的供应商提供。

反向ETL也是现代数据架构的最后一部分,因此对它感兴趣的企业通常已经与ETL/ELT和数据复制解决方案的供应商建立了关系。因此,为反向ETL寻找一个单独的平台似乎很自然。

但是,随着时间的推移,数据集成将成为业务的核心方面,企业将不再意识到集成过程之间的差异。用于集成的工具将变得更加用户友好,用户将不再需要考虑连接数据源和数据目的地的工程类型。

他们想要一个服务于所有集成类型的与架构无关的平台。

业务人员变得更有数据素养,从低代码到无代码的商业智能,数据集成工具成为标准。

认识到需要精通数据的非技术专业人士的比例很高(Qlik公司在2022年的一项调查显示为58%),期望他们精通数据的决策者的比例更高(Forrester公司在2022年进行的一项调查显示为82%)。如果这些专业人士想要在就业市场上保持竞争力,他们将不得不培养过去是工程师专属领域的能力。

对他们来说,幸运的是,运营数据工具(商业智能工具、数据集成工具,甚至一些数据存储)所需的技术知识越来越少。

根据调研机构Gartner公司的预测,到2025年,70%由企业开发的新应用程序将依赖于低代码和无代码技术。虽然“低代码”和“无代码”这两个术语经常用于描述开发平台,但人们将越来越多地看到它们用于描述商业智能和数据集成平台。

这一趋势再加上企业内部对数据素养的推动,将有效地减轻工程师的工作,并使非技术员工能够构建自己的数据解决方案。

(3)对公民数据科学家的需求仍在增加

公民数据科学家是业务部门的专业人士,他们对数据和分析有一定的了解,有时也会编码,但他们并不是数据科学家。在不久的将来,他们将在弥合业务团队和数据团队之间的差距方面发挥重要作用。他们的职责包括确定成功的度量,收集和解释数据,评估和部署数据模型。

根据美国劳工统计局的预测,到2029年,数据科学领域的增长将超过其他任何领域。因此,像英国石油公司和Epsilon这样的全球性公司已经从公民数据科学家那里获益也就不足为奇了。

这类新专业人员的崛起将对许多企业的数据治理策略产生去中心化的影响,这是由中心辐射型治理模型定义的。

由此产生的业务团队的授权将把数据团队的重点转移到安全和质量上。

(4)数据安全成为买家关注的主要问题

对于那些希望在运营层面拥有更大分析灵活性的企业来说,分散数据能力是必要的。但是,随着数据泄露和其他隐私问题越来越普遍,这也使他们面临更高程度的风险。

在欧洲,数据保护部门不断对违反GDPR法规的行为开出罚单,其中一些科技公司遭到高昂的罚款。到目前为止,2022年最高一笔罚款高达4.05亿欧元,这是Instagram所有者Meta Platforms公司在2022年9月遭到的罚款数额。

尽管美国联邦没有专门的数据隐私法,但企业仍要担心各州的相关法律,当然还要防范黑客的攻击。微软、Uber、红十字会和News Corporatio等企业和机构在2022年都遭到了黑客攻击。

SaaS买家正在注意到并很快会更加意识到他们向供应商提供了哪些数据。供应商将发现,如果没有类似SOC2这样的认证,就很难完成大宗交易。人们可以看到这一点。最终,数据安全将优先于用户友好性和价格等其他购买标准。

(5)数据质量仍然是一个挑战,人工智能在清理数据方面发挥着更大的作用

只要一直在收集数据,数据质量就一直是一个挑战。随着数据来自越来越多的不同来源,并由越来越多的业务线专业人员处理,将错误扩散到下游系统带来的损失变得越来越显著。

Gartner公司在2021年估计,不良数据每年给企业造成的平均损失为1290万美元。

尽管确保数据质量是一个难题,但在分析和数据集成工具中逐步实施基于人工智能的机制将极大地有助于保持高质量(例如Dataddo是一款集成工具,内置人工智能异常检测器) 。

这些技术将在标记异常值方面变得越来越好,并将丢失、不正确和损坏的数据排除在管道和仪表板之外。

同样重要的是要注意,由于基于人工智能的数据质量解决方案在长期分析大型数据集时总是最有效的,因此它们应该始终与以人为本的解决方案一起实施。

(6)商业智能工具成为被动使用的移动友好型工具

商业智能进入移动领域似乎很自然。数据的消费者(例如营销人员、销售人员和上层管理人员)经常需要访问数据,像仓库工作人员和卡车司机这样不会在电脑前花费大量时间的专业人士需要采用移动商业智能工具。

因此,移动商业智能的市场价值预计将从2021年的100亿美元增长到2030年的约555亿美元。然而,这只是全球商业智能市场价值的一小部分,预计商业智能市场的价值将从2020年的352亿美元增加到2028年的2242亿美元。

无论移动商业智能工具变得多么先进和精简,将主要用于提供见解。对于产生见解,采用台式机将永远是主流。

(7)保持领先

数字化转型的竞赛是一场极具活力的竞赛。保持行业领先的一种方法是密切关注数据管理和商业智能的新兴趋势。它们可以让人们预测即将发生的事情,并有助于了解如今实施的战略。

企业应该考虑:

  • 通过为最终用户提供更多支持,积极推动SaaS工具的采用。
  • 投资于面向未来的数据集成工具。
  • 培养非技术业务专业人员的数据素养。
  • 尽一切努力符合国际数据安全标准。

有关2023年及以后的七个大数据趋势预测的更多相关文章

  1. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  2. ruby - Ruby 有 `Pair` 数据类型吗? - 2

    有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

  3. ruby - 我如何添加二进制数据来遏制 POST - 2

    我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_

  4. 世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2

    无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD

  5. 华为OD机试用Python实现 -【明明的随机数】 2023Q1A - 2

    华为OD机试题本篇题目:明明的随机数题目输入描述输出描述:示例1输入输出说明代码编写思路最近更新的博客华为od2023|什么是华为od,od薪资待遇,od机试题清单华为OD机试真题大全,用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为o

  6. FOHEART H1数据手套驱动Optitrack光学动捕双手运动(Unity3D) - 2

    本教程将在Unity3D中混合Optitrack与数据手套的数据流,在人体运动的基础上,添加双手手指部分的运动。双手手背的角度仍由Optitrack提供,数据手套提供双手手指的角度。 01  客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照:https://gitee.com/foheart_1/foheart-h1-data-summary.git02  数据转发打开MotiveBody软件的Streaming,开始向Unity3D广播数据;MotionVenus中设置->选项选择Unit

  7. 使用canal同步MySQL数据到ES - 2

    文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目,Java开发。基于数据库增量日志解析,提供增量数据订阅&消费。Git地址:https://github.co

  8. ruby-on-rails - 创建 ruby​​ 数据库时惰性符号绑定(bind)失败 - 2

    我正在尝试在Rails上安装ruby​​,到目前为止一切都已安装,但是当我尝试使用rakedb:create创建数据库时,我收到一个奇怪的错误:dyld:lazysymbolbindingfailed:Symbolnotfound:_mysql_get_client_infoReferencedfrom:/Library/Ruby/Gems/1.8/gems/mysql2-0.3.11/lib/mysql2/mysql2.bundleExpectedin:flatnamespacedyld:Symbolnotfound:_mysql_get_client_infoReferencedf

  9. STM32读取串口传感器数据(颗粒物传感器,主动上传) - 2

    文章目录1.开发板选择*用到的资源2.串口通信(个人理解)3.代码分析(注释比较详细)1.主函数2.串口1配置3.串口2配置以及中断函数4.注意问题5.源码链接1.开发板选择我用的是STM32F103RCT6的板子,不过代码大概在F103系列的板子上都可以运行,我试过在野火103的霸道板上也可以,主要看一下串口对应的引脚一不一样就行了,不一样的就更改一下。*用到的资源keil5软件这里用到了两个串口资源,采集数据一个,串口通信一个,板子对应引脚如下:串口1,TX:PA9,RX:PA10串口2,TX:PA2,RX:PA32.串口通信(个人理解)我就从串口采集传感器数据这个过程说一下我自己的理解,

  10. SPI接收数据异常问题总结 - 2

    SPI接收数据左移一位问题目录SPI接收数据左移一位问题一、问题描述二、问题分析三、探究原理四、经验总结最近在工作在学习调试SPI的过程中遇到一个问题——接收数据整体向左移了一位(1bit)。SPI数据收发是数据交换,因此接收数据时从第二个字节开始才是有效数据,也就是数据整体向右移一个字节(1byte)。请教前辈之后也没有得到解决,通过在网上查阅前人经验终于解决问题,所以写一个避坑经验总结。实际背景:MCU与一款芯片使用spi通信,MCU作为主机,芯片作为从机。这款芯片采用的是它规定的六线SPI,多了两根线:RDY和INT,这样从机就可以主动请求主机给主机发送数据了。一、问题描述根据从机芯片手

随机推荐