草庐IT

CLOUDERA

全部标签

hadoop - 无法连接到服务器 : quickstart. cloudera/10.0.2.15:8032

[cloudera@quickstart~]$sqoopimport-connectjdbc:mysql://localhost/test-usernameroot-P-tabletransactions-m1执行上述命令时,出现以下异常。Warning:/usr/lib/sqoop/../accumulodoesnotexist!Accumuloimportswillfail.Pleaseset$ACCUMULO_HOMEtotherootofyourAccumuloinstallation.18/02/1002:06:16INFOsqoop.Sqoop:RunningSqoopve

hadoop - Cloudera/Hive - 主机名更改后无法访问表

我创建了一个Cloudera集群并从OracleDB导入了一些示例测试文件。但过了一会儿,我不得不更改节点的主机名。我按照cloudera网站中提到的指南进行操作,一切正常。但是当我尝试访问我之前创建的表(同时使用hive和impala)时,出现以下错误:获取结果遇到以下错误:java.io.IOException:java.lang.IllegalArgumentException:java.net.UnknownHostException:[旧主机名]然后我在同一个数据库下创建了另一个表(使用Hue>Metastore表),我可以毫无问题地访问在新主机名下创建的这些新表。谁能解释一

r - 在 Cloudera CDH4 上编译 R 包时 GCC 出错

我正在尝试在Cloudera的CDH4HadoopVM上安装RHadoop。RHadoop是一个通过R编程接口(interface)使用Hadoop的框架。安装RHadoopR包“rmr”的先决条件之一是另一个名为Rcpp的R包,它用于从R调用C++代码。当我尝试安装该包时,出现以下错误。我联系了Rcpp和RHadoop社区,他们都说这是一个GCC问题。当我尝试更新或重新安装GCC时,我得到“软件包gcc-4.4.6-4.e16.x86_64已安装且为最新版本,无需执行任何操作。”有什么建议吗?这是错误(来自R命令行)。>install.packages("Rcpp")Installi

hadoop - Cloudera CDH VM 默认 HADOOP_HOME 位置

ClouderaCDH4VM中的默认HADOOP_HOME位置是什么。echo$HADOOP_HOME返回空白。 最佳答案 /usr/lib/hadoop是CDH4中的默认HADOOP_HOME。关于弃用,HADOOP_PREFIX似乎是HADOOP_HOME的替代品:$HADOOP_HOMEisdeprecated我相信HADOOP_MAPRED_HOME仅用于mapreduce基础设施,如果您直接使用HDFS,那么您可能需要HADOOP_PREFIX。 关于hadoop-Cloude

java - 为 Cloudera 升级 Java 版本有多安全?

我有一个运行ClouderaStandard4.7.3和CDH4.5以及Java1.6的cloudera集群。根据ClouderaDocumetation这些版本支持java1.7。我想知道这次升级是否安全,或者是否存在潜在问题? 最佳答案 我们将集群升级到java1.7,M/R作业和Hive作业都没有任何问题 关于java-为Cloudera升级Java版本有多安全?,我们在StackOverflow上找到一个类似的问题: https://stackover

java - 需要协助运行 Cloudera 提供的 WordCount.java

大家好,我正在尝试运行Cloudera提供的WordCount.java示例。我运行了下面的命令,得到了我放在命令下面的异常。那么你对如何进行有什么建议吗?我已经完成了cloudera提供的所有步骤。提前致谢。hadoopjar~/Desktop/wordcount.jarorg.myorg.WordCount~/Desktop/input~/Desktop/output错误:ERRORsecurity.UserGroupInformation:PriviledgedActionExceptionas:root(auth:SIMPLE)cause:org.apache.hadoop.m

hadoop - Cloudera 经理。未能检测到 Cloudera Manager Server

我有两台装有CentOS6.5的PCclient86-101.aihs.net80.94.86.101client86-103.aihs.net80.94.86.103cloudera-manager-server安装在client86-101.aihs.net上。我在检测ClouderaManagerServer时遇到问题(集群安装的第3步。)问题跟踪:BEGINhost-tPTR80.94.86.101101.86.94.80.in-addr.arpadomainnamepointerclient86-101.aihs.net.END(0)usingclient86-101.aih

hadoop - Datanode 没有连接到 Namenode cloudera

我想通过Talend从远程机器访问cloudera以获取大数据。为此,我通过编辑文件/etc/hosts和/etc/sysconfig/network更改了cloudera中主机的ip。我可以从Talend访问cloudera。但是问题是我的数据节点和名称节点似乎没有连接。当我检查我的Datanode的日志详细信息时,出现以下错误:BlockpoolBP-1183376682-127.0.0.1-1433878467265(DatanodeUuidnull)servicetoquickstart.cloudera/127.0.0.1:8022beginninghandshakewith

hadoop - "Child Error"in Executing stream Job on multi node Hadoop cluster (cloudera distribution CDH3u0 Hadoop 0.20.2)

我在8节点Hadoop集群上工作,我正在尝试使用指定的配置执行一个简单的流作业。hadoopjar/usr/lib/hadoop-0.20/contrib/streaming/hadoop-streaming-0.20.2-cdh3u0.jar\-Dmapred.map.max.tacker.failures=10\-Dmared.map.max.attempts=8\-Dmapred.skip.attempts.to.start.skipping=8\-Dmapred.skip.map.max.skip.records=8\-Dmapred.skip.mode.enabled=tru

hadoop - 5.6 GB 对 Cloudera 来说还不够吗?

我在笔记本电脑和OracleVirtualBoxVM上运行ClouderaHadoop。我已经从我的8核中分配了5.6GB,从八核中分配了6GB。而且我仍然无法保持它的正常运行。即使没有负载服务也不会保持正常运行,当我尝试查询时至少Hive会在20分钟内关闭。有时它们像多米诺骨牌一样倒下:一个接一个。更多的内存似乎对某些人有所帮助:使用3GB和所有服务时,当Hue本身设法启动时,Hue正在闪烁红色。重新启动后,我需要30到60分钟才能使系统启动到足以尝试在其上运行任何东西。有两个明智的注意事项(我设法找到了):-交换警告。-当系统使用26GB的虚拟内存不足时出现崩溃。我的数据集不到一兆