7月28日,在袋鼠云2022产品发布会上,袋鼠云技术负责人思枢正式宣布旗下产品「大数据基础平台EasyMR」发布。
EasyMR是袋鼠云自研的大数据基础平台,提供Hadoop、Hive、Spark、Trino、HBase、Kafka等组件,完全兼容Apache开源生态;支持企业级安全管控,一键开启LDAP+Kerberos+Ranger认证权限体系;提供一站式运维管理平台,帮助企业快速构建大数据平台,降低运维成本。
结合袋鼠云在数字化领域多年的寸积铢累,此次全新发布的大数据基础平台EasyMR紧跟开源生态的先进技术,不仅可以帮助客户轻松应对海量数据的采集、存储、计算、分析挖掘和数据安全等应用场景,并且对于智能运维的部署、升级、扩缩容、监控等进行全方位支持,真正做到成为企业便捷、智能、高效的“数据底座”。
不同于十年前的新奇,现在大家已经完全习惯自己身处于“大数据时代”这件事情,所有人都能够深切地感受到大数据对于生活带来的各种改变和便利,数据爆发的时代推动着每个个人、企业、行业,甚至是国家往前走。
当前国际形势风云变幻,中美双边关系的割裂,国家对于信创国产化的大力支持,给国内的大数据行业带来巨大冲击的同时,也带来了全新机遇。
数据基础平台作为一切的基础和底座,自然成为国产替代的重中之重。只有真正拥有了自主可控的平台建设能力,才能逐步建立基于自己的 IT 底层架构和标准,形成自有开放生态。
EasyMR就是这样一款自主研发、完全可控的,致力于助力企业信息化智慧转型的“企业数据底座”。

下面通过描述EasyMR的主要特性,来具体说说,EasyMR是如何帮助企业实现智能的?
● 界面化集群运维
Hadoop集群、大数据平台在日常运维中涉及到的节点扩容缩容、组件停止启动、服务滚动重启、服务参数修改、版本升级与回滚等多种运维操作,通过逻辑化、流程化的产品界面展现,方便运维人员操作和监控,提高运维效率。
● 自动化部署
EasyMR通过规范化的步骤和参数约定制作出产品安装包,发布包中的Schema文件中配置了安装包中所有的服务,包含各服务的配置参数、健康检查参数,服务之间的依赖关系等。产品部署时可根据Schema中的相关配置实现一键全自动化部署。
● 仪表盘集群监控
通过集成开源的Promethus和Grafana,实现对集群、服务、节点的核心参数监控,并通过灵活形象的仪表盘进行数据展现。包含CPU占用率,RAM使用率、磁盘空间、IO读写速率等核心参数进行监控,实时掌握集群、服务、节点的运行状态,降低运维故障率。同时,支持用户自建仪表盘及监控项,实现自定义监控项。
● 实时告警
支持实时监控集群中各组件服务的运行指标,如CPU、内存、磁盘、读写IO等,并支持短信、钉钉、邮件告警通道配置,集成多种第三方消息插件。当集群服务出现异常时,可触发告警条件,系统将及时通知接收人。
● 强扩展性
通过自研的Easyagent Server抽象出七大REST接口,安装、启动、停止、更新、配置修改、卸载、执行等与上层应用进行交互,可使agent类别和功能可轻松无限扩展。
● 安全稳定
数据安全、产品安全是大数据产品需要重点考虑的问题。EasyMR在产品设计中过滤掉rm、drop等命令行,防止对数据库的误操作,通过更加安全的方式执行相关命令。同时提供服务的滚动重启、产品的断电重启,解决运维时服务不停止运行的场景并节省运维时间。
EasyMR支持Hadoop2.8.5、Hadoop3.2.1大数据集群搭建,支持丰富的大数据组件,用户可以根据业务需要进行组件的选择。
那么,EasyMR具体支持那些大数据组件呢?
● Yarn
版本支持:
· Yarn 支持Hadoop 2.8.5、3.2.1
主要功能为Hadoop的资源调度器,负责管理整个Hadoop集群的资源(CPU和内存)管理和调度。
● Hdfs
版本支持:
· Hdfs 支持Hadoop 2.8.5、3.2.1
Hdfs即Hadoop 分布式文件系统,是Hadoop的三大基础组件之一,主要是处理大数据场景下数据的增、删、改、查、文件切片等功能。
● Flink
版本支持:
· Flink 1.12
面向数据流处理和批量数据处理的可分布式的开源计算框架。
● Spark
版本支持:
· Spark 2.4.8
基于内存的新一代分布式开源大数据框架,支持离线,实时计算,也支持 SQL 语法以及机器学习的处理。
EasyMR对开源组件的SQL的DDL能力进行了增强,支持Add Column语法。
● Hive
版本支持:
· Hive 2.3.8
· Hive 3.1.2
基于Hadoop的一套离线数据处理系统,在HDFS之上提供了结构化的表数据的管理能力,提供类 SQL 的查询语法进行数据分析处理。
● Trino
版本支持:
· Trino 0.359
分布式SQL查询引擎, 用来专门进行高速、实时的数据分析。
EasyMR对Trino的Connector进行了增强,支持Connector的动态加载;对社区的Connector进行了扩展,支持星环Inceptor插件。
● Hbase
版本支持:
· Hbase 1.3.5
· Hbase 2.3.4
一款高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库。
● Zookeeper
版本支持:
· Zookeeper 3.6.2
分布式应用程序协调服务,分布式应用程序可基于它实现同步服务,配置维护和命名服务等,为分布式集群提供一种可靠、可扩展、分布式、可配置的协调机制来统一系统的状态。
其中,简洁、易上手也是EasyMR的一大优势。EasyMR既希望帮助企业实现多源数据的高效集成,全量数据的高效分析,同时也希望能够降低平台的使用门槛,不会让上手难度成为影响企业数字化转型进程的一道壁垒。
所以,和我们一起进行一次大数据产品的安装部署吧!
EasyMR支持多集群的统一管理。

基于物理机/虚拟机进行主机集群创建。

「添加主机」,通过账号接入、命令行接入的方式进行主机节点的添加


选择平台已有的组件安装包进行安装部署,或者通过本地上传、网络上传的方式上传自己的组件安装包。

EasyMR支持单个产品包的手动部署和多个产品包的自动部署两种部署方式。
自动部署通过上传产品线定义组件部署流程,平台解析筛选相关组件,根据定义的主机角色实现自动资源自动编排,平台根据依赖关系完成组件的顺序部署,大大节省了运维逐个部署、资源配置的时间。

产品安装过程中,我们可以实时看到服务部署进度、查看部署日志,服务部署情况一目了然。

EasyMR通过集成开源的promethus和grafana,实现对集群、服务、节点的核心参数监控,并通过灵活形象的仪表盘进行数据展现。包含CPU占用率,RAM使用率、磁盘空间、I/O读写速率等核心参数进行监控,实时掌握集群、服务、节点的运行状态,降低运维故障率。同时,支持用户自建仪表盘及监控项,实现自定义监控项。

平台提供 “短信通道、邮件通道、钉钉通道、企业微信通道、自定义通道” 5种通道配置,用户根据需要选择合适通道并填写通道配置信息、消息模板、地址等完成通道配置。


没错,EasyMR就是这样一款好用、易用、高效的大数据基础工具,覆盖企业服务监控运维、组件的升级与回滚、离线数据分析、流式数据处理等多种应用场景。
未来EasyMR将坚持自主创新,不断进化,将积累的大数据实践经验复制到更多的企业。
袋鼠云开源框架钉钉技术交流qun(30537511),欢迎对大数据开源项目有兴趣的同学加入交流最新技术信息,开源项目库地址:https://github.com/DTStack/Taier
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳
我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_
无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD
本教程将在Unity3D中混合Optitrack与数据手套的数据流,在人体运动的基础上,添加双手手指部分的运动。双手手背的角度仍由Optitrack提供,数据手套提供双手手指的角度。 01 客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照:https://gitee.com/foheart_1/foheart-h1-data-summary.git02 数据转发打开MotiveBody软件的Streaming,开始向Unity3D广播数据;MotionVenus中设置->选项选择Unit
文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目,Java开发。基于数据库增量日志解析,提供增量数据订阅&消费。Git地址:https://github.co
1.postman介绍Postman一款非常流行的API调试工具。其实,开发人员用的更多。因为测试人员做接口测试会有更多选择,例如Jmeter、soapUI等。不过,对于开发过程中去调试接口,Postman确实足够的简单方便,而且功能强大。2.下载安装官网地址:https://www.postman.com/下载完成后双击安装吧,安装过程极其简单,无需任何操作3.使用教程这里以百度为例,工具使用简单,填写URL地址即可发送请求,在下方查看响应结果和响应状态码常用方法都有支持请求方法:getpostputdeleteGet、Post、Put与Delete的作用get:请求方法一般是用于数据查询,
我正在尝试在Rails上安装ruby,到目前为止一切都已安装,但是当我尝试使用rakedb:create创建数据库时,我收到一个奇怪的错误:dyld:lazysymbolbindingfailed:Symbolnotfound:_mysql_get_client_infoReferencedfrom:/Library/Ruby/Gems/1.8/gems/mysql2-0.3.11/lib/mysql2/mysql2.bundleExpectedin:flatnamespacedyld:Symbolnotfound:_mysql_get_client_infoReferencedf
Ⅰ软件测试基础一、软件测试基础理论1、软件测试的必要性所有的产品或者服务上线都需要测试2、测试的发展过程3、什么是软件测试找bug,发现缺陷4、测试的定义使用人工或自动的手段来运行或者测试某个系统的过程。目的在于检测它是否满足规定的需求。弄清预期结果和实际结果的差别。5、测试的目的以最小的人力、物力和时间找出软件中潜在的错误和缺陷6、测试的原则28原则:20%的主要功能要重点测(eg:支付宝的支付功能,其他功能都是次要的)80%的错误存在于20%的代码中7、测试标准8、测试的基本要求功能测试性能测试安全性测试兼容性测试易用性测试外观界面测试可靠性测试二、质量模型衡量一个优秀软件的维度①功能性功
文章目录1.开发板选择*用到的资源2.串口通信(个人理解)3.代码分析(注释比较详细)1.主函数2.串口1配置3.串口2配置以及中断函数4.注意问题5.源码链接1.开发板选择我用的是STM32F103RCT6的板子,不过代码大概在F103系列的板子上都可以运行,我试过在野火103的霸道板上也可以,主要看一下串口对应的引脚一不一样就行了,不一样的就更改一下。*用到的资源keil5软件这里用到了两个串口资源,采集数据一个,串口通信一个,板子对应引脚如下:串口1,TX:PA9,RX:PA10串口2,TX:PA2,RX:PA32.串口通信(个人理解)我就从串口采集传感器数据这个过程说一下我自己的理解,