草庐IT

hadoop - Cloudera CDH4 : Can't add a host to my cluster because canonical name is not consistent with hostname

我正在使用Ubuntu12.04LTS在4节点集群上安装CDH4。我能够安装cloudera管理器并在主机上启动单节点集群。但是,一旦我添加了一个新主机,CM就会说它运行状况不佳并抛出以下错误:“从Java进程检查时,此主机的主机名和规范名称不一致。”我修改了master和所有主机上的/etc/hosts的内容,以包含IP地址,后跟每台机器的FQDN。我是否还需要设置一个DNS服务器才能完成这项工作? 最佳答案 您不一定需要设置DNS服务器才能使其正常工作,但正向和反向DNS必须明确匹配Hadoop才能正常运行。Hadoop操作书有

java - Cassandra 错误 :Invalid method name "describe local ring"

我正在使用java在hadoop中开发一个项目。当我在本地集群上运行我的代码(jar)时它工作正常但是当我在亚马逊多集群上运行它时它会给出异常...我的mapreduce作业代码....job.setJarByClass(ReadActivityDriver.class);job.setMapperClass(ReadActivityLogMapper.class);job.setReducerClass(ReadActivityLogReducer.class);job.setMapOutputKeyClass(Text.class);job.setMapOutputValueCla

python - 导入错误 : No module named 'MySQL'

我已成功下载MySQL连接器/Python。我在Python的shell中使用了以下代码来测试我的连接:导入mysql.connector我收到以下错误消息:Traceback(mostrecentcalllast):File"",line1,inimportmysql.connectorImportError:Nomodulenamed'mysql'我不明白为什么MySQL没有被识别。 最佳答案 我遇到了类似的问题。我的环境细节-python2.7.11点9.0.1CentOS5.11版(最终版)python解释器出错->>>im

python - 导入错误 : No module named 'MySQL'

我已成功下载MySQL连接器/Python。我在Python的shell中使用了以下代码来测试我的连接:导入mysql.connector我收到以下错误消息:Traceback(mostrecentcalllast):File"",line1,inimportmysql.connectorImportError:Nomodulenamed'mysql'我不明白为什么MySQL没有被识别。 最佳答案 我遇到了类似的问题。我的环境细节-python2.7.11点9.0.1CentOS5.11版(最终版)python解释器出错->>>im

hadoop - Rack Awareness 和 Name node 的区别

我正在研究Hadoop,我怀疑Rackwareness和NameNode之间是否有区别。将Rackwareness和namenode保留在同一个盒子上 最佳答案 正如Aviral所说的那样,这个问题非常模糊。但只是为了您的理解而引用,Namenode:NameNode是HDFS文件系统的核心。它保留文件系统中所有文件的目录树,并跟踪文件数据在集群中的保存位置。它不存储这些文件本身的数据。客户端应用程序在希望定位文件或希望添加/复制/移动/删除文件时与NameNode通信。NameNode通过返回数据所在的相关DataNode服务器列

ubuntu - Accumulo 的 Start-all.sh 抛出多个关于 : Max open files on localhost 的警告

我收到关于以下内容的多个警告:WARN:Maxopenfilesonlocalhostis1024,recommend32768我不确定这是关于什么的。/usr/local/accumulo$./bin/start-all.sh&[1]27142/usr/local/accumulo$StartingmonitoronlocalhostWARN:Maxopenfilesonlocalhostis1024,recommend32768Startingtabletservers....doneStartingtserveronlocalhostWARN:Maxopenfilesonloca

Hadoop:连接到主机 localhost 端口 22:运行 start-dfs.sh 时连接被拒绝

当使用start-dfs.sh启动最新的(2014年10月)Hadoop时,我们看到:connecttohostlocalhostport22:Connectionrefusedwhenrunning 最佳答案 安装openssh服务器。对于Ubuntu命令是:sudoapt-getinstallopenssh-server在hadoop-env.sh文件中(存在于/etc/hadoop中)添加以下行:exportHADOOP_SSH_OPTS="-p22" 关于Hadoop:连接到主机

hadoop - pig : How to remove '::' in the column name

我有一个像下面这样的pig关系:最终={input_md5::type:chararray,input_md5::name:chararray,input_md5::id:long,input_md5::age:chararray,test_1::type:chararray,test_2::name:chararray}我正在尝试存储input_md5的所有列与hive表的关系。喜欢所有input_md5::type:chararray,input_md5::name:chararray,input_md5::id:long,input_md5::age:chararray不服用te

hadoop - cdh4.3,日志异常,./start-dfs.sh后,datanode和namenode启动失败

这是来自hadoop-datanode-...log的日志:FATALorg.apache.hadoop.hdfs.server.datanode.DataNode:block池初始化失败block池BP-1421227885-192.168.2.14-1371135284949(存储IDDS-30209445-192.168.2.41-50010-1371109358645)服务于/192.168.2.8:8020org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.protocol.Disallowe

hadoop - ./zkServer.sh status 联系服务时出错。它可能没有运行

我已经安装了zookeeper3.4.9版本和我的zoo.cfg文件配置如下initLimit=10syncLimit=5dataDir=/usr/local/zookeeper/clientPort=2181DataLogDir=/usr/local/log/server.1=hadoop-master:2888:3888server.2=hadoop-slave-1:2889:3889server.3=hadoop-slave-2:2890:3890当然我已经在三个节点的/usr/local/zookeeper/data/myid下启动了myid文件它包含hadoop-master