在Cloudera快速启动中访问Hue时出现以下错误。我检查了连接性,看起来不错。我希望是否有人可以指导我如何解决,因为我是Hadoop的初学者并且遇到了这个问题?我感谢任何帮助。 最佳答案 快速启动VM需要6-8GB的RAM才能正常工作。否则,您的内存可能正在交换并导致它没有响应 关于hadoop-Cloudera快速启动无响应脚本,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions
我编写了一个hadoop1.0.4应用程序,它可以在半分布式模式下在本地正常运行。我还在我的集群上安装了ClouderaHadoop4。我认为CDH4运行hadoop1.0.4,因为它在hadoop站点上被列为稳定,但事实似乎并非如此。当我在集群上运行应用程序时,出现以下错误:12/11/2716:14:38WARNmapred.JobClient:UseGenericOptionsParserforparsingthearguments.ApplicationsshouldimplementToolforthesame.12/11/2716:14:38INFOinput.FileIn
我已按照说明成功安装了一个Cloudera4节点Hadoop集群,其中包括所有软件,如HBase等。然后安装并构建了asynchbase,然后是OpenTSDB。似乎奏效了。但是,当我尝试按照他们的网站“入门指南”运行它时,会输出此错误。有什么提示吗?谢谢。[root@n1opentsdb-1.1.0]#./build/tsdbtsd--port=4242--staticroot=build/staticroot--cachedir="$tsdtmp"2013-05-2814:31:38,928INFO[main]TSDMain:Starting.2013-05-2814:31:38,
我正在尝试使用ClouderamanagerpythonAPI来启动和停止集群。是否也可以使用此API停止管理角色?如果你能告诉我命令或文档页面吗?谢谢 最佳答案 这是一个关于如何使用pythonCMAPI停止管理服务的例子#python中的CMAPIfromcm_api.api_clientimportApiResourceapi=ApiResource("cm-host.cloudera.com")mgmt=api.get_cloudera_manager().get_service()#停止管理服务mgmt.stop()#启动
我想将数据从CDH3复制到CDH4(在不同的服务器上)。我的CDH4服务器设置为无法看到CDH3,因此我必须将数据从CDH3上游推送到CDH4。(这意味着我无法从CDH4运行distcp命令来复制数据)。如何通过在较低版本的CDH3hadoop上运行命令将我的数据传输到CDH4的HDFS,或者这不可能吗? 最佳答案 理想情况下,您应该能够使用distcp将数据从一个HDFS集群复制到另一个。hadoopdistcp-p-update"hdfs://A:8020/user/foo/bar""hdfs://B:8020/user/foo
我在vmware中使用clouderaquickstart来运行示例Oozie。我正在尝试运行Cloudera中的一些Oozie示例。我正在关注此链接:http://archive.cloudera.com/cdh/3/oozie/DG_Examples.html我解压缩了“oozie-examples.tar.gz”并获得了示例目录。运行oozie时,我收到一条错误消息:[cloudera@localhostoozie-3.3.2+92]$ooziejob-ooziehttp://localhost:11000/oozie-configexamples/apps/map-reduce
我有多个csv文件,我想将它们导入CDH表。我想知道是否有类似sqoop的工具可以从文件中导入数据。有什么方法或工具可以自动完成吗? 最佳答案 您可以使用HueWebUI。使用FileBrowser菜单将文件上传到hdfs。之后你可以使用数据浏览器/Metastore表创建新模式/使用上传的文件创建新表。 关于hadoop-如何加载csv文件数据到CDH?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co
我正在我现有的CDH5.5.2集群上安装Kafka-2.0,这是我遵循的过程从CM添加服务选择Kafka(在此之前我在所有节点上下载并分发并激活了kafkaparcel)为KafkaBroker选择了1个节点,为KafkaMirrorMaker选择了4个节点然后我使用MirrorMaker节点之一更新了我的目标代理列表(bootstrap.servers)属性以及具有相同节点的源代理列表(source.bootstrap.servers)我得到以下错误(日志文件)FatalerrorduringKafkaServerStartablestartup.Preparetoshutdownj
我已经为此工作了很长时间,我感到很疲惫;我希望来自SO社区的[显而易见的?]见解可能会让我的宠物项目重新开始,这样我就可以停止踢自己了。我正在使用ClouderaCDH3、HBase.89和Hadoop.20。我有一个Python/Django应用程序,它使用Thrift接口(interface)将数据写入单个HBase表,效果很好。现在我想将它映射/减少到更多的HBase表中。这里明显的答案是Dumbo或ApachePIG,但是对于Pig,我的版本尚不支持HBaseStorage适配器(Pig能够加载类和定义,但在“映射”步骤卡住,提示“输入拆分”;Pig邮件列表建议这在Pig0.8
我正在运行Cloudera的VM(CH3)。我在我的文本编辑器中复制了一个简单的UDF,但我不知道如何编译它以便能够在脚本中调用它。PigUDF手册http://pig.apache.org/docs/r0.7.0/udf.html说要构建pig.jar,但是指向SVN的链接已断开:svncohttp://svn.apache.org/repos/asf/hadoop/pig/trunk.有人可以告诉我他们是如何编译UDF的吗?谢谢 最佳答案 最简单的方法是使用MavenrepositoryfromCloudera,您只需将Pig指