草庐IT

vm-cdh-cluster

全部标签

hadoop - cdh4.3,日志异常,./start-dfs.sh后,datanode和namenode启动失败

这是来自hadoop-datanode-...log的日志:FATALorg.apache.hadoop.hdfs.server.datanode.DataNode:block池初始化失败block池BP-1421227885-192.168.2.14-1371135284949(存储IDDS-30209445-192.168.2.41-50010-1371109358645)服务于/192.168.2.8:8020org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.protocol.Disallowe

hadoop - Sqoop import --as-parquetfile with CDH5

我正在尝试将数据直接从mysql导入到parquet,但它似乎无法正常工作...我正在使用包含Sqoop1.4.5的CDH5.3。这是我的命令行:sqoopimport--connectjdbc:mysql://xx.xx.xx.xx/database--usernameusername--passwordmypass--query'SELECTpage_id,user_idFROMpages_usersWHERE$CONDITIONS'--split-bypage_id--hive-import--hive-tabledefault.pages_users3--target-dirh

hadoop - CDH5 hdfs 平衡器错误

运行“hdfsbalancer”,我确实看到它显示了安装的机架拓扑、过度使用和未充分使用的节点,它说“需要移动5TB以使集群平衡”和“决定从10.150移动10GB字节.11.24:50010到10.150.11.164:50010"然后我看到这个错误,WARNbalancer.Balancer:Dispatcherthreadfailedjava.lang.NullPointerExceptionatorg.apache.hadoop.hdfs.server.balancer.Balancer.isGoodBlockCandidate(Balancer.java:1233)atorg

hadoop - 如何解决 Oozie 错误 : JA009: Cannot initialize Cluster. 检查 mapreduce.framework.name 的配置

我一直在使用oozie来安排spark作业。尝试使用Oozie中可用的spark操作在2.x集群中部署spark作业。在我的job.properties中,我有以下内容`nameNode=hdfs://hostname:8020jobTracker=hostname:8050master=yarn-clusterqueueName=defaultoozie.use.system.libpath=true`当我提交oozie作业时,我一直收到此错误错误:错误代码[JA009],消息[JA009:无法初始化集群。请检查您的mapreduce.framework.name配置和相应的服务器地

hadoop - "Child Error"in Executing stream Job on multi node Hadoop cluster (cloudera distribution CDH3u0 Hadoop 0.20.2)

我在8节点Hadoop集群上工作,我正在尝试使用指定的配置执行一个简单的流作业。hadoopjar/usr/lib/hadoop-0.20/contrib/streaming/hadoop-streaming-0.20.2-cdh3u0.jar\-Dmapred.map.max.tacker.failures=10\-Dmared.map.max.attempts=8\-Dmapred.skip.attempts.to.start.skipping=8\-Dmapred.skip.map.max.skip.records=8\-Dmapred.skip.mode.enabled=tru

hadoop hbase cdh4 作业启动失败,出现权限错误

在CDH4生态系统中,我正在尝试将mapreduce作业输出到hbase表。由于某种原因,它在配置设置的addDependencyJars调用期间失败。据我所知,hbase配置没有选择hadoop配置(请参阅作业输出中的警告)。我提供了hdfs-site.xml、作业配置、带堆栈跟踪的作业输出和文件权限。任何有关如何进一步调试的帮助或见解将不胜感激。hdfs-site.xmldfs.permissions.enabledfalsedfs.permissions.superusergrouphadoopdfs.namenode.name.dir/var/hadoop/namenodedf

scala - 当我尝试通过 Cloudera VM 在 spark 中运行 scala 命令时,topology.py 出现语法错误

每次我尝试按照Scala命令运行valdataRDD=sc.textFile("hdfs://quickstart.cloudera:8020/user/cloudera/data/data.txt")dataRDD.collect().foreach(println)//ordataRDD.count()我得到以下异常-exitCodeExceptionexitCode=1:File"/etc/hadoop/conf.cloudera.yarn/topology.py",line43printdefault_rack^SyntaxError:Missingparenthesesinc

hadoop - 亚马逊电子病历 : Initializing a cluster with data

我正在使用AmazonEMR,并且能够使用CLI工具创建和运行工作流。作业运行良好。但是,当我尝试将数据从S3和名称节点的本地文件系统加载到我的EMR集群的HDFS时遇到了问题。我想从S3填充HDFS。我正在尝试使用S3DistCp工具执行此操作。我正在运行这个命令:elastic-mapreduce--jobflow$JOBFLOWID--jars3://us-east-1.elasticmapreduce/libs/s3distcp/1.0.1/s3distcp.jar--arg--src--arg's3n://my-bucket/src'--arg--dest--arg'hdfs

hadoop - Cloudera 的 CDH4 WordCount hadoop 教程 - 问题

我正在学习本教程:http://www.cloudera.com/content/cloudera-content/cloudera-docs/HadoopTutorial/CDH4/Hadoop-Tutorial/ht_topic_5_2.html内容如下:javac-cpclasspath-dwordcount_classesWordCount.javawhereclasspathis:CDH4-/usr/lib/hadoop/*:/usr/lib/hadoop/client-0.20/*CDH3-/usr/lib/hadoop-0.20/hadoop-0.20.2-cdh3u4-

hadoop - 无法在 Mahout 中实例化类型 Cluster、KMean 聚类示例

您好,我试图在Mahout中运行KmeanClusteringExample,但遇到了示例代码中的错误。我在下面的代码片段中遇到错误集群cluster=newCluster(vec,i,newEuclideanDistanceMeasure());报错CannotinstantiatetheTypeCluster(这是一个接口(interface),我的理解)。我想在我的样本数据集上运行kmeans,任何人都可以指导我吗?我在我的EClipseIDE中包含了以下Jarmahout-math-0.7-cdh4.3.0.jarhadoop-common-2.0.0-cdh4.2.1.jar