Cloudera-CDH

hadoop - Cloudera快速启动无响应脚本

在Cloudera快速启动中访问Hue时出现以下错误。我检查了连接性，看起来不错。我希望是否有人可以指导我如何解决，因为我是Hadoop的初学者并且遇到了这个问题？我感谢任何帮助。最佳答案快速启动VM需要6-8GB的RAM才能正常工作。否则，您的内存可能正在交换并导致它没有响应关于hadoop-Cloudera快速启动无响应脚本，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions

Cloudera hadoop section 时出 stackoverflow hue cloudera-quickstart-vm

hadoop - Cloudera Hadoop 没有运行 hadoop 1.0.4？

我编写了一个hadoop1.0.4应用程序，它可以在半分布式模式下在本地正常运行。我还在我的集群上安装了ClouderaHadoop4。我认为CDH4运行hadoop1.0.4，因为它在hadoop站点上被列为稳定，但事实似乎并非如此。当我在集群上运行应用程序时，出现以下错误:12/11/2716:14:38WARNmapred.JobClient:UseGenericOptionsParserforparsingthearguments.ApplicationsshouldimplementToolforthesame.12/11/2716:14:38INFOinput.FileIn

hadoop Cloudera section JobClient mapreduce

java - 在 Cloudera VMWare CentOS 6.4 4 节点集群上运行 OpenTSDB 时出错

我已按照说明成功安装了一个Cloudera4节点Hadoop集群，其中包括所有软件，如HBase等。然后安装并构建了asynchbase，然后是OpenTSDB。似乎奏效了。但是，当我尝试按照他们的网站“入门指南”运行它时，会输出此错误。有什么提示吗？谢谢。[root@n1opentsdb-1.1.0]#./build/tsdbtsd--port=4242--staticroot=build/staticroot--cachedir="$tsdtmp"2013-05-2814:31:38,928INFO[main]TSDMain:Starting.2013-05-2814:31:38,

时出 Cloudera java 2013 main hadoop hbase opentsdb

hadoop - 使用 python API 启动或停止 cloudera 管理器管理服务

我正在尝试使用ClouderamanagerpythonAPI来启动和停止集群。是否也可以使用此API停止管理角色？如果你能告诉我命令或文档页面吗？谢谢最佳答案这是一个关于如何使用pythonCMAPI停止管理服务的例子#python中的CMAPIfromcm_api.api_clientimportApiResourceapi=ApiResource("cm-host.cloudera.com")mgmt=api.get_cloudera_manager().get_service()#停止管理服务mgmt.stop()#启动

管理服务 cloudera section code hadoop cloudera-manager

hadoop - 如何将数据从 CDH3 集群迁移到(不同的)CDH4 集群？

我想将数据从CDH3复制到CDH4(在不同的服务器上)。我的CDH4服务器设置为无法看到CDH3，因此我必须将数据从CDH3上游推送到CDH4。(这意味着我无法从CDH4运行distcp命令来复制数据)。如何通过在较低版本的CDH3hadoop上运行命令将我的数据传输到CDH4的HDFS，或者这不可能吗？最佳答案理想情况下，您应该能够使用distcp将数据从一个HDFS集群复制到另一个。hadoopdistcp-p-update"hdfs://A:8020/user/foo/bar""hdfs://B:8020/user/foo

CDH hadoop section CDH4 hdfs cloudera

hadoop - 使用 Cloudera VM 问题运行 Oozie

我在vmware中使用clouderaquickstart来运行示例Oozie。我正在尝试运行Cloudera中的一些Oozie示例。我正在关注此链接:http://archive.cloudera.com/cdh/3/oozie/DG_Examples.html我解压缩了“oozie-examples.tar.gz”并获得了示例目录。运行oozie时，我收到一条错误消息:[cloudera@localhostoozie-3.3.2+92]$ooziejob-ooziehttp://localhost:11000/oozie-configexamples/apps/map-reduce

Cloudera hadoop oozie localhost section

hadoop - 如何加载csv文件数据到CDH？

我有多个csv文件，我想将它们导入CDH表。我想知道是否有类似sqoop的工具可以从文件中导入数据。有什么方法或工具可以自动完成吗？最佳答案您可以使用HueWebUI。使用FileBrowser菜单将文件上传到hdfs。之后你可以使用数据浏览器/Metastore表创建新模式/使用上传的文件创建新表。关于hadoop-如何加载csv文件数据到CDH？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.co

hadoop csv section stackoverflow questions cloudera cloudera-cdh bigdata

hadoop - 现有 CDH 5.5.2 集群上的 Kafka 配置

我正在我现有的CDH5.5.2集群上安装Kafka-2.0，这是我遵循的过程从CM添加服务选择Kafka(在此之前我在所有节点上下载并分发并激活了kafkaparcel)为KafkaBroker选择了1个节点，为KafkaMirrorMaker选择了4个节点然后我使用MirrorMaker节点之一更新了我的目标代理列表(bootstrap.servers)属性以及具有相同节点的源代理列表(source.bootstrap.servers)我得到以下错误(日志文件)FatalerrorduringKafkaServerStartablestartup.Preparetoshutdownj

hadoop Kafka scala LogCleaner apache-kafka hadoop2 rhel cloudera-cdh

python - 在 CDH3 上编写 HBase MapReduce 的最简单的非 Java 方法？

我已经为此工作了很长时间，我感到很疲惫；我希望来自SO社区的[显而易见的？]见解可能会让我的宠物项目重新开始，这样我就可以停止踢自己了。我正在使用ClouderaCDH3、HBase.89和Hadoop.20。我有一个Python/Django应用程序，它使用Thrift接口(interface)将数据写入单个HBase表，效果很好。现在我想将它映射/减少到更多的HBase表中。这里明显的答案是Dumbo或ApachePIG，但是对于Pig，我的版本尚不支持HBaseStorage适配器(Pig能够加载类和定义，但在“映射”步骤卡住，提示“输入拆分”；Pig邮件列表建议这在Pig0.8

MapReduce 编写 section HBase Pig python hadoop

hadoop - 如何在Cloudera的Hadoop+Pig发行版中编译一个UDF

我正在运行Cloudera的VM(CH3)。我在我的文本编辑器中复制了一个简单的UDF，但我不知道如何编译它以便能够在脚本中调用它。PigUDF手册http://pig.apache.org/docs/r0.7.0/udf.html说要构建pig.jar，但是指向SVN的链接已断开:svncohttp://svn.apache.org/repos/asf/hadoop/pig/trunk.有人可以告诉我他们是如何编译UDF的吗？谢谢最佳答案最简单的方法是使用MavenrepositoryfromCloudera，您只需将Pig指

何在 Cloudera section noreferrer noopener hadoop apache-pig user-defined-functions

23 24 252627 28 29