vm-cdh-cluster

java - 由于 cloudera quickstart vm 中的 yarn 容器错误，Hipi 平均像素数程序失败

我是HIPI/Hadoop的新手，所以我选择了clouderaquickstartvm(5.4.2)。我正在关注gettingstarted教程来做到这一点。在运行时我发现我在hib文件中有如下所示的文件:[cloudera@quickstarttools]$./hibInfo.shexamples/sampleNew.hib--show-metaInputHIB:examples/sampleNew.hibDisplaymetadata:trueDisplayEXIFdata:falseIMAGEINDEX:01244x829format:1meta:{source=/home/cl

像素数容器 cloudera examples hipi-release java hadoop cloudera-quickstart-vm hipi

java - slave VM 从 slaves 列表中删除，并且仍然被 Yarn/Tez 访问

所以我从从属虚拟机列表中删除了vm4，当我运行以下命令时它不会访问它hdfsdfsadmin-report结果是:ubuntu@anmol-vm1-new:~$hdfsdfsadmin-report15/12/1406:56:12WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicableConfiguredCapacity:1268169326592(1.15TB)PresentCapacity:1199270457

仍然 slaves code hadoop Remaining java hdfs hadoop-yarn master-slave

hadoop - CDH5.4 - HADOOP_HOME

我想问一下，CDH5.4的HADOOP_HOME路径是什么？最佳答案应该是:/opt/cloudera/parcels/CDH-5.4.0-1.cdh5.4.0.p0.27/lib/hadoop 关于hadoop-CDH5.4-HADOOP_HOME，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/36521347/

HADOOP_HOME hadoop section stackoverflow cloudera-cdh

linux - 转瞬即逝 + hive : CLUSTERED TABLE

我在HIVE中有聚簇表。所有查询都在hive-client中工作。但是我不能用这个表运行任何查询:Query...failed:Hivetableiscorrupt.Itisdeclaredasbeingbucketed,butthefilesdonotmatchthebucketingdeclaration.Thenumberoffilesinthedirectory(0)doesnotmatchthedeclaredbucketcount(8)forpartition:在设置hive.enforce.bucketing=true;之后错误:Query...failed:Hiveta

转瞬即逝转瞬 code section bucketing linux hadoop hive presto

hadoop - pig : optimal number of maps with a 4 node cluster?

我正在使用只有4个节点的hadoopCloudera系统，但磁盘空间很大(200TB)。在我的pig脚本中，我每月加载几个文件，每个文件的大小约为200Gb。我注意到，如果我在我的pig脚本中加载大约一年的数据，Pig会创建大约15k个mappers，整个过程大约需要3个小时(包括reduce步骤)。相反，如果我加载三年的数据(大约5TB)，那么Pig会创建大约30k个mappers，基本上所有节点在处理超过15次后都会变得不健康小时。我是不是遇到了瓶颈？或者我应该使用一些默认选项？我的pig脚本非常基本:我分组，我数数。非常感谢! 最佳答案

cluster optimal strong section code hadoop apache-pig cloudera

hadoop - 通过 VM 安装 Ubuntu 以进行 Hadoop 环境设置

我是Hadoop领域的新手。我想知道设置hadoop环境的系统要求。我的笔记本电脑有4GB内存、1TB硬盘和Windows10操作系统。我的4GBRAM大小可以通过VM安装Ubuntu吗？或者我应该扩展我的RAM大小吗？最佳答案至少8GB内存，但我建议使用16GB，因为您需要一些内存用于Windows和所有办公工具。https://fr.hortonworks.com/tutorial/sandbox-deployment-and-install-guide/section/1/ 关

hadoop Ubuntu strong section sandbox-deployment-and-install-gu virtual-machine

hadoop - 将 parquet-tools 与 Kerberos CDH 结合使用

我正在尝试从parquet文件中发现模式。我尝试使用代码:parquet-toolsschemahdfs://:8020///.parquet但是我得到了错误:SIMPLEauthenticationisnotenabled.Available:[TOKEN,KERBEROS]有谁知道如何在Kerberized环境中使用parquet-tools。我有带权限的keytab，我在knit命令之前运行。最佳答案 hadoop.security.authentication的配置可以取值SIMPLE或KERBEROS。从你得到的错误来看

parquet-tools Kerberos section code strong hadoop parquet cloudera-cdh

hadoop - cdh3 客户端可与 apache hadoop 服务器 0.20.xx 互操作？

我们有一个基于hadoop-core-0.20.2-cdh3u1.jar的java客户端。针对运行apache分布式0.20.xx的服务器(集群)工作是否安全？还是cloudera破坏了一些apacheAPI？谢谢最佳答案可能是个坏主意。尝试与使用hadoop-core版本0.20.203.0的客户端一起使用cdh3u1的服务器并得到:org.apache.hadoop.ipc.RPC$VersionMismatch:Protocolorg.apache.hadoop.hdfs.protocol.ClientProtocolve

hadoop apache section cloudera

hadoop - 从 CDH4 jar 文件构建 Hadoop Ecplise 库

我正在尝试构建一个包含在Eclipse中构建map/reduce作业所需的所有jar文件的Hadoop库。在Ubuntu上安装Hadoop时，我需要哪些.jar文件以及从单节点安装CDH4的哪些文件夹？最佳答案假设您已经从https://ccp.cloudera.com/display/SUPPORT/CDH4+Downloadable+Tarballs下载了CDH4tarball发行版解压缩tarball在解压后的目录中找到build.properties文件:hadoop-2.0.0-cdh4.0.0/src/hadoop-

Ecplise hadoop code section

hadoop hdfs 从 cdh3 迁移到 cdh4

我有两个hadoop集群，我的目标是使用hadoop-cp将所有hdfs文件从cluster1复制到cluster2集群1:Hadoop0.20.2-cdh3u4集群2:Hadoop2.0.0-cdh4.1.1现在，即使只是在cluster2上远程对cluster1运行dfs-ls命令，如下所示:hadoopfs-lshdfs://cluster1-namenode:8020/hbase我遇到异常:ls:因本地异常而失败:java.io.IOException:响应为空。；主机详细信息:本地主机是:“cluster2-namenode/10.21.xxx.xxx”；目标主机是:“clu

cdh hadoop strong cluster cluster1 hbase hdfs microsoft-distributed-file-system

17 18 192021 22 23