草庐IT

vm-cdh-cluster

全部标签

java - 由于 cloudera quickstart vm 中的 yarn 容器错误,Hipi 平均像素数程序失败

我是HIPI/Hadoop的新手,所以我选择了clouderaquickstartvm(5.4.2)。我正在关注gettingstarted教程来做到这一点。在运行时我发现我在hib文件中有如下所示的文件:[cloudera@quickstarttools]$./hibInfo.shexamples/sampleNew.hib--show-metaInputHIB:examples/sampleNew.hibDisplaymetadata:trueDisplayEXIFdata:falseIMAGEINDEX:01244x829format:1meta:{source=/home/cl

java - slave VM 从 slaves 列表中删除,并且仍然被 Yarn/Tez 访问

所以我从从属虚拟机列表中删除了vm4,当我运行以下命令时它不会访问它hdfsdfsadmin-report结果是:ubuntu@anmol-vm1-new:~$hdfsdfsadmin-report15/12/1406:56:12WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicableConfiguredCapacity:1268169326592(1.15TB)PresentCapacity:1199270457

hadoop - CDH5.4 - HADOOP_HOME

我想问一下,CDH5.4的HADOOP_HOME路径是什么? 最佳答案 应该是:/opt/cloudera/parcels/CDH-5.4.0-1.cdh5.4.0.p0.27/lib/hadoop 关于hadoop-CDH5.4-HADOOP_HOME,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/36521347/

linux - 转瞬即逝 + hive : CLUSTERED TABLE

我在HIVE中有聚簇表。所有查询都在hive-client中工作。但是我不能用这个表运行任何查询:Query...failed:Hivetableiscorrupt.Itisdeclaredasbeingbucketed,butthefilesdonotmatchthebucketingdeclaration.Thenumberoffilesinthedirectory(0)doesnotmatchthedeclaredbucketcount(8)forpartition:在设置hive.enforce.bucketing=true;之后错误:Query...failed:Hiveta

hadoop - pig : optimal number of maps with a 4 node cluster?

我正在使用只有4个节点的hadoopCloudera系统,但磁盘空间很大(200TB)。在我的pig脚本中,我每月加载几个文件,每个文件的大小约为200Gb。我注意到,如果我在我的pig脚本中加载大约一年的数据,Pig会创建大约15k个mappers,整个过程大约需要3个小时(包括reduce步骤)。相反,如果我加载三年的数据(大约5TB),那么Pig会创建大约30k个mappers,基本上所有节点在处理超过15次后都会变得不健康小时。我是不是遇到了瓶颈?或者我应该使用一些默认选项?我的pig脚本非常基本:我分组,我数数。非常感谢! 最佳答案

hadoop - 通过 VM 安装 Ubuntu 以进行 Hadoop 环境设置

我是Hadoop领域的新手。我想知道设置hadoop环境的系统要求。我的笔记本电脑有4GB内存、1TB硬盘和Windows10操作系统。我的4GBRAM大小可以通过VM安装Ubuntu吗?或者我应该扩展我的RAM大小吗? 最佳答案 至少8GB内存,但我建议使用16GB,因为您需要一些内存用于Windows和所有办公工具。https://fr.hortonworks.com/tutorial/sandbox-deployment-and-install-guide/section/1/ 关

hadoop - 将 parquet-tools 与 Kerberos CDH 结合使用

我正在尝试从parquet文件中发现模式。我尝试使用代码:parquet-toolsschemahdfs://:8020///.parquet但是我得到了错误:SIMPLEauthenticationisnotenabled.Available:[TOKEN,KERBEROS]有谁知道如何在Kerberized环境中使用parquet-tools。我有带权限的keytab,我在knit命令之前运行。 最佳答案 hadoop.security.authentication的配置可以取值SIMPLE或KERBEROS。从你得到的错误来看

hadoop - cdh3 客户端可与 apache hadoop 服务器 0.20.xx 互操作?

我们有一个基于hadoop-core-0.20.2-cdh3u1.jar的java客户端。针对运行apache分布式0.20.xx的服务器(集群)工作是否安全?还是cloudera破坏了一些apacheAPI?谢谢 最佳答案 可能是个坏主意。尝试与使用hadoop-core版本0.20.203.0的客户端一起使用cdh3u1的服务器并得到:org.apache.hadoop.ipc.RPC$VersionMismatch:Protocolorg.apache.hadoop.hdfs.protocol.ClientProtocolve

hadoop - 从 CDH4 jar 文件构建 Hadoop Ecplise 库

我正在尝试构建一个包含在Eclipse中构建map/reduce作业所需的所有jar文件的Hadoop库。在Ubuntu上安装Hadoop时,我需要哪些.jar文件以及从单节点安装CDH4的哪些文件夹? 最佳答案 假设您已经从https://ccp.cloudera.com/display/SUPPORT/CDH4+Downloadable+Tarballs下载了CDH4tarball发行版解压缩tarball在解压后的目录中找到build.properties文件:hadoop-2.0.0-cdh4.0.0/src/hadoop-

hadoop hdfs 从 cdh3 迁移到 cdh4

我有两个hadoop集群,我的目标是使用hadoop-cp将所有hdfs文件从cluster1复制到cluster2集群1:Hadoop0.20.2-cdh3u4集群2:Hadoop2.0.0-cdh4.1.1现在,即使只是在cluster2上远程对cluster1运行dfs-ls命令,如下所示:hadoopfs-lshdfs://cluster1-namenode:8020/hbase我遇到异常:ls:因本地异常而失败:java.io.IOException:响应为空。;主机详细信息:本地主机是:“cluster2-namenode/10.21.xxx.xxx”;目标主机是:“clu