草庐IT

vm-cdh-cluster

全部标签

azure - 如何查询azure hdinsight hadoop cluster yarn timeline server

如何查询AzureHDInsightHadoop集群中的时间线服务器以获取作业指标?连接到Azure集群:curl-uadmin-sS-G"https://$CLUSTERNAME.azurehdinsight.net/api/v1/clusters/$CLUSTERNAME"连接到时间线服务器:GET/ws/v1/timeline/我需要一个连接这两个的查询来获取AzureHDInsightHadoop集群的作业指标。提前致谢。 最佳答案 查询Yarn时间线服务器:sshuser@clustername:~$curl-uadmin

hadoop - 使用 Cloudera Manager 安装 CDH : No such file or directory

使用CM安装并成功下载和分发所有包裹。但是,所有代理都不会在分发100%完成时解压包裹。检查日志,它说:[21/Nov/201809:53:04+0000]30292MainThreadparcelINFOExecutingcommand['chown','root:yarn',u'/opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/lib/hadoop-yarn/bin/container-executor'][21/Nov/201809:53:04+0000]30292MainThreadparcelINFOchmod:/opt

hadoop - 在不同硬件机器的 VM 之间安装 hadoop 集群

我负责向一群人(假设5个人)教授Hadoop,但没有任何可用的硬件。他们每个人都有一台笔记本电脑,配备相当大的内存和处理器。我想让他们在自己的笔记本电脑之间创建一个Hadoop集群,这些笔记本电脑将连接到同一网络。到目前为止,我的想法是:创建一个预配置了ubuntu16的VM镜像(ubuntu16是我的选择),为集群节点做好准备让他们每个人在自己的计算机上运行虚拟机在此VM网络之上创建集群但是,我有一些锁:1/是否可以创建位于不同机器上的VM的私有(private)网络,以便hadoop集群与链接物理机器的网络隔离?2/这种方法有什么问题?3/有没有更好的方法来处理在不同个人机器之间设

hadoop - 用于cloudera cdh3u2的LZO

带着一些困惑,我阅读了cloudera'sblogpostonlzooncloudera.由于一些许可bs,lzo压缩不是标准hadoop的一部分,好的。但是,是什么阻止了cloudera将其作为其发行版的一部分?还是这件事发生了?简而言之,如何在clouderacdh3u2上进行lzo压缩? 最佳答案 Butwhat'sstoppingclouderafrommakingitpartoftheirdistribution?Orhasthishappened?ApacheHadoop和ClouderaCDH都是released在相同

linux - CDH4 JAVA_HOME Ubuntu

我已经在CentOs上以伪分布式模式安装了CDH4,没有任何问题,但是当我在Ubuntu12.04上安装它时,我在设置JAVA_HOME环境变量时遇到了一些错误。我安装了JDK并在/etc/profile.d和~/bash.rc中使用以下行正确设置了JAVA_HOME:exportJAVA_HOME=/usr/local/java/latestexportPATH=${JAVA_HOME}/bin:$PATH我知道在这两个地方定义它是多余的,但显然在/etc/profile.d中设置它是行不通的。从我的用户那里,当我输入$echo$JAVA_HOME时,我得到:/usr/local/j

hadoop - CDH 5.1主机IP地址变更

我有一个包含3个节点的CDH5.1集群。我们使用clouderamanager自动安装来安装它。在我们将盒子移动到不同的网络并更改IP地址之前,它一直运行良好。我尝试了以下步骤1.Stoppedservice,cloudera-scm-server.2.Stoppedservice,cloudera-scm-agent3.Editthe/etc/cloudera-scm-agent/config.ini4.changetheserverhosttothenewip.5.restartservice,cloudera-scm-agent,cloudera-scm-server.不工作。然

hadoop - CDH 5.2 启动 NodeManager-Service 时出错 NodeManager 在 INITED 状态下失败;原因 : java. lang.NullPointerException

2014-11-2119:05:37,532INFOorg.apache.hadoop.yarn.server.nodemanager.containermanager.localizer.LocalizedResource:Resourcehdfs://hadoop-master.nycloudlab.internal:8020/user/admin/.staging/job_1415362431963_0311/libjars/hbase-hadoop-compat.jar(->/yarn/nm/usercache/admin/filecache/1513/hbase-hadoop

hadoop - 能否将CDH3的HBase数据导出,导入CDH5的HBase?

我们有一个旧的基于CDH3的集群,我们将数据存储在该集群上的HBase中。我们还有全新的集群,其中安装了CDH5.2。我们想将HBase数据从CDH3集群迁移到CDH5集群。我想知道是否可以跨不同版本迁移数据?是否像使用distcp命令一样直接?在迁移数据之前和迁移过程中我需要采取哪些预防措施? 最佳答案 我认为对此没有简单的解决方案。我能想到的最简单的解决方案是使用一个MapReduce作业将每个HBase表导出到CDH3集群上的HDFS。一个DistCp作业将导出的HDFS数据从您的CDH3集群传输到CDH5集群上的HDFS,最

ubuntu - 权限被拒绝 : u'/opt/cloudera/parcel-cache/CDH-5. 3.3-1.cdh5.3.3.p0.5-precise.parcel.part'

我正在尝试安装具有3个节点的hadoopcloudera集群,所有这些节点都是ubuntu12.04机器。为此,我做了以下事情。我已经在所有机器上创建了hduser,并通过以下命令授予它root权限。sudoaddgrouphadoopsudoadduser--ingrouphadoophdusersudoadduserhdusersudosudosuhduser然后在所有机器上通过以下命令为无密码ssh生成无密码key。机器详细信息:master-1ip:192.168.0.101slave-1ip:192.168.0.102slave-2ip:192.168.0.103命令:ssh

hadoop - Cloudera 5.4.4 Cluster - 获取聚合使用指标

我想从Cloudera5.4.4Hadoop集群收集汇总使用指标。我心目中的一些指标如下:集群每天/每周的平均CPU利用率Hadoop上运行时间最长的n个作业/查询最常使用集群的前n个用户(按利用率、提交的作业数)集群磁盘使用率与磁盘容量集群磁盘使用量随时间增长是否有任何API/资源/工具等我可以用来开始这个?我不认为我完全确定从哪里开始。任何起点将不胜感激。另外,请分享您在集群使用指标方面的经验(如果有的话)。提前致谢! 最佳答案 Ganglia是一个用于大型集群的开源、可扩展的分布式监控系统。它收集、汇总并提供数十个与机器相关的