草庐IT

Cloudera-Manager-Installation

全部标签

hadoop - "Child Error"in Executing stream Job on multi node Hadoop cluster (cloudera distribution CDH3u0 Hadoop 0.20.2)

我在8节点Hadoop集群上工作,我正在尝试使用指定的配置执行一个简单的流作业。hadoopjar/usr/lib/hadoop-0.20/contrib/streaming/hadoop-streaming-0.20.2-cdh3u0.jar\-Dmapred.map.max.tacker.failures=10\-Dmared.map.max.attempts=8\-Dmapred.skip.attempts.to.start.skipping=8\-Dmapred.skip.map.max.skip.records=8\-Dmapred.skip.mode.enabled=tru

hadoop - 5.6 GB 对 Cloudera 来说还不够吗?

我在笔记本电脑和OracleVirtualBoxVM上运行ClouderaHadoop。我已经从我的8核中分配了5.6GB,从八核中分配了6GB。而且我仍然无法保持它的正常运行。即使没有负载服务也不会保持正常运行,当我尝试查询时至少Hive会在20分钟内关闭。有时它们像多米诺骨牌一样倒下:一个接一个。更多的内存似乎对某些人有所帮助:使用3GB和所有服务时,当Hue本身设法启动时,Hue正在闪烁红色。重新启动后,我需要30到60分钟才能使系统启动到足以尝试在其上运行任何东西。有两个明智的注意事项(我设法找到了):-交换警告。-当系统使用26GB的虚拟内存不足时出现崩溃。我的数据集不到一兆

scala - 当我尝试通过 Cloudera VM 在 spark 中运行 scala 命令时,topology.py 出现语法错误

每次我尝试按照Scala命令运行valdataRDD=sc.textFile("hdfs://quickstart.cloudera:8020/user/cloudera/data/data.txt")dataRDD.collect().foreach(println)//ordataRDD.count()我得到以下异常-exitCodeExceptionexitCode=1:File"/etc/hadoop/conf.cloudera.yarn/topology.py",line43printdefault_rack^SyntaxError:Missingparenthesesinc

hadoop - Cloudera 的 CDH4 WordCount hadoop 教程 - 问题

我正在学习本教程:http://www.cloudera.com/content/cloudera-content/cloudera-docs/HadoopTutorial/CDH4/Hadoop-Tutorial/ht_topic_5_2.html内容如下:javac-cpclasspath-dwordcount_classesWordCount.javawhereclasspathis:CDH4-/usr/lib/hadoop/*:/usr/lib/hadoop/client-0.20/*CDH3-/usr/lib/hadoop-0.20/hadoop-0.20.2-cdh3u4-

apache - Cloudera hadoop的conf目录在哪里?

我一直在寻找ClouderaHadoop/conf目录所在的位置,但找不到。我使用Cloudera的一键式软件包存储库安装了namenode,并运行了sudoapt-getinstall-yhadoop-hdfs-namenode,但现在我需要找到code>/conf这样我就可以配置Hadoop集群了。有人知道它在哪里吗? 最佳答案 它在通常的地方,/etc/hadoop/conf。您会发现这实际上是一个使用alternatives的符号链接(symboliclink),但您可以根据需要转到此目录查找/编辑配置。不过,通过Cloud

java - Hive 在创建表 "Cannot validate serde: com.cloudera.hive.serde.JSONSerDe"时抛出错误

正在使用apache-hive-0.13.1。在创建表配置单元时抛出如下错误FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.Cannotvalidateserde:com.cloudera.hive.serde.JSONSerDe表结构为createexternaltabletweets(idBigInt,created_atString,scourceString,favoritedBoolean,retweet_countint,retweeted_statusStruct>,e

hadoop - 定位 Cloudera Manager HDFS 配置文件

我已经通过ClouderaManager安装了一个集群,现在我需要手动启动集群。我一直在使用以下命令:$sudo-uhdfshadoopnamenode/datanode/jobtracker但是dfs.name.dir被设置为/tmp。我似乎找不到cloudera管理器在哪里有HDFS配置文件。/usr/lib/hadoop-02*/conf中的那些似乎是最小的。他们缺少dfs.name.dir,这是我特别要找的。顺便说一下,我在RHLE6系统上。由于懒惰,我虽然可以只复制cloudera管理器的HDFS配置文件,所以我不必手动创建它们,将它们复制到6个节点:)谢谢

hadoop - HDFS 作为 cloudera quickstart docker 中的卷

我对hadoop和docker都很陌生。我一直致力于扩展cloudera/quickstartdocker镜像docker文件,并希望从主机挂载一个目录并将其映射到hdfs位置,以便提高性能并在本地持久保存数据。当我使用-v/localdir:/someDir在任何地方安装卷时,一切正常,但这不是我的目标。但是当我执行-v/localdir:/var/lib/hadoop-hdfs时,datanode和namenode都无法启动,我得到:“cd/var/lib/hadoop-hdfs:权限被拒绝”。当我执行-v/localdir:/var/lib/hadoop-hdfs/cache时,

hadoop - "Got error creating database manager"- sqoop 导入查询出错

场景:我正在尝试从sqlserver导入到HDFS,但出现以下错误:错误:hadoop@ubuntu:~/sqoop-1.1.0/bin$./sqoopimport--connect'jdbc:sqlserver://192.168.230.1;username=xxx;password=xxxxx;database=HadoopTest'--tablePersonInfo--target-dir/home/hadoop/hadoop-0.21.0/11/12/1012:13:20ERRORtool.BaseSqoopTool:Goterrorcreatingdatabasemanag

hadoop - Cloudera 管理器 : Where do I put Java ClassPath for MapReduce jobs?

我已经让Hadoop-Lzo在我的本地伪集群上愉快地工作,但是第二次我在生产中尝试相同的jar文件时,我得到:java.lang.RuntimeException:native-lzolibrarynotavailable库已验证在DataNode上,所以我的问题是:我在什么屏幕/设置中指定native-lzo库的位置? 最佳答案 对于MapReduce,您需要将条目添加到MapReduce客户端环境安全阀。您可以通过转到配置下的查看和编辑选项卡找到MapReduceClientSafety。然后在那边添加这些行:HADOOP_CL