草庐IT

cloudera-manager

全部标签

java - Cloudera 中的 WordCount 作业成功但 reducer 的输出与 mapper 的输出相同

这个程序是用Cloudera编写的。这是我创建的驱动程序类。importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.IntWritable;importorg.apache.hadoop.io.Text;importorg.apache.hadoop.mapreduce.Job;importorg.apache.hadoop.mapreduce.lib.input.FileInputFormat;importorg.apache.hadoo

java - 使用 Cloudera 5.14 和 Spark2 : Livy can't find its own JAR files 配置 Livy

我是Cloudera的新手,正在尝试将工作负载从运行Ambari和Livy和Spark2.2.x的HDP服务器转移到具有类似设置的CDH5服务器。由于Livy不是Cloudera的组件,我使用的是他们网站上的0.5.0-incubating版本,在与YARN、Spark和HDFSmasters相同的服务器之一上运行它。长话短说,当我尝试提交给Livy时,我收到以下错误消息:Diagnostics:Filefile:/home/livy/livy-0.5.0-incubating-bin/rsc-jars/livy-rsc-0.5.0-incubating.jardoesnotexist

hadoop - Cloudera 管理器在 ubuntu 12.0.4LTS 上安装失败

我尝试在ubuntu上安装最新的cloudera管理器,当我在psuedo分布式模式下安装cluser时,出现以下错误,有人可以建议我该怎么做我确实已经尝试过以下a)禁用iptablesb)将我的etc主机更改为具有以下条目127.0.0.1本地主机127.0.0.1localhost.localdomainlocalhost安装失败。无法从代理接收心跳。Ensurethatthehost'shostnameisconfiguredproperly.Ensurethatport7182isaccessibleontheClouderaManagerserver(checkfirewal

java - 如何在 Cloudera hadoop 中使用外部 jar?

我的集群上安装了clouderahadoop版本4。它与googleprotobufferjar2.4版打包在一起。在我的应用程序代码中,我使用了使用protobuffer2.5版编译的protobuffer类。这会导致运行时无法解决的编译问题。有没有一种方法可以使用外部jar运行mapreduce作业,或者我会卡住直到cloudera升级他们的服务?谢谢。 最佳答案 是的,您可以使用外部jar运行MR作业。请务必在提交作业时向HADOOP_CLASSPATH和-libjars添加任何依赖项,如以下示例所示:您可以使用以下命令添加当

hadoop - 如何在 EMR 上安装 cloudera impala?

无论如何,我是否可以安装唯一没有cloudera管理器和cdh的impala。我将使用hadoop的apache版本? 最佳答案 是的,这是绝对可能的。将存储库添加到您的sources.list文件中,然后更新存储库。deb[arch=amd64]http://archive.cloudera.com/impala/ubuntu/precise/amd64/impalaprecise-impala1contribdeb-srchttp://archive.cloudera.com/impala/ubuntu/precise/amd6

hadoop - 将 HUE 界面语言设置/强制为英语(Hadoop/Cloudera)

由于某种原因,当我从我的机器访问它时,hue界面语言是德语。(德语语言设置,但英语浏览器和操作系统)如何强制hue始终显示英文? 最佳答案 Hue正在采用您的浏览器发送的首选语言环境。您浏览器中的德语语言环境可能设置为比英语语言环境更高的优先级。Thisarticle说明您可以在哪里更改它。 关于hadoop-将HUE界面语言设置/强制为英语(Hadoop/Cloudera),我们在StackOverflow上找到一个类似的问题: https://stacko

hadoop - Cloudera安装疑惑?

我是cloudera的新手,我在我的系统中成功安装了cloudera我有两个疑问,考虑一台机器的一些节点已经使用hadoop处理一些数据,我们可以安装Cloudera以使用现有的Hadoop而不对现有hadoop存储的数据进行任何更改或修改。我在我的机器上安装了Cloudera,我还有另外三台机器可以将它们添加为集群,我想知道,在将这些机器添加为集群之前,我是否要在这三台机器上安装cloudera?,或者我们可以添加一个节点作为集群而不在那个特定节点上安装cloudera?。在此先感谢任何人,请提供有关上述问题的一些信息。 最佳答案

hadoop - 克伯罗斯 |云时代 | Krb异常 : Encryption type AES256 CTS mode with HMAC SHA1-96

我一直在尝试为CDH4.5设置Kerberos,这是使用ClouderaManager安装程序设置的。说明来自以下链接:http://www.cloudera.com/content/cloudera-content/cloudera-docs/CM4Ent/4.5.2/Configuring-Hadoop-Security-with-Cloudera-Manager/cmeechs_topic_4.html设置和KDC后,我将Java6文件的JCE策略复制到以下位置:/usr/java/jdk1.6.0_31/lib/security/以下是我的“/var/kerberos/krb5

xml - 可以将 HCatalog 与 XML 一起使用吗? -- 在 Cloudera VM 上执行 ETL

我正在处理一个大数据类的项目,我已经在本地安装了ClouderaQuickstartVM以在我的数据集上运行一些基本任务并熟悉一些工具。我正在学习一个教程,其中涉及将数据集移动到HDFS,基于数据集文件创建一个HCatalog表,然后在该表上运行Hive和/或Pig命令。问题是我的数据是一个大的XML文件,HCatalog中的标准分隔符选项不适用。有没有办法将XML导入HCatalog?如果不是,在我的XML数据集上使用Hive或Pig的最佳方法是什么?编辑:我的文件来自公共(public)StackOverflow数据集。我正在使用posts.xml文件。它非常大(25GB),我无法

hadoop - 如何在 Cloudera 的 Cassandra 中启用节俭?

enterimagedescriptionhere我是Cassandra和cloudera编程的新手。我有错误“没有按要求启动RPC服务器,使用JMX(存储服务->启动rpc或nodetool(enablethrift)来启动它”。我从几个小时开始就在尝试启用盗窃使用nodetool但徒劳无功。我在Cassandra位置找到了一个文件“Enablethrift.html”,但我不知道该怎么做。请帮忙 最佳答案 更改cassandra.yaml:start_rpc:false到start_rpc:true