草庐IT

CLOUDERA

全部标签

hadoop - copyFromLocalFile 在 CDH4 中不起作用

我已经在亚马逊云(1台服务器)的ubuntu12LTS服务器上成功安装了CDH4。我使用ClouderaManager免费版安装软件并且没有错误)。我有一个程序使用javaAPI将文件从我的家用计算机加载到云中的HDFS。我想知道为什么这个程序失败以及如何修复它。Configurationconf=newConfiguration();conf.set("fs.defaultFS","hdfs://node01:8020");FileSystemfs=FileSystem.get(conf);PathtargetPath=newPath("/users//myfile.txt");Pa

hadoop - Cloudera 管理器在 ubuntu 12.0.4LTS 上安装失败

我尝试在ubuntu上安装最新的cloudera管理器,当我在psuedo分布式模式下安装cluser时,出现以下错误,有人可以建议我该怎么做我确实已经尝试过以下a)禁用iptablesb)将我的etc主机更改为具有以下条目127.0.0.1本地主机127.0.0.1localhost.localdomainlocalhost安装失败。无法从代理接收心跳。Ensurethatthehost'shostnameisconfiguredproperly.Ensurethatport7182isaccessibleontheClouderaManagerserver(checkfirewal

java - 如何在 Cloudera hadoop 中使用外部 jar?

我的集群上安装了clouderahadoop版本4。它与googleprotobufferjar2.4版打包在一起。在我的应用程序代码中,我使用了使用protobuffer2.5版编译的protobuffer类。这会导致运行时无法解决的编译问题。有没有一种方法可以使用外部jar运行mapreduce作业,或者我会卡住直到cloudera升级他们的服务?谢谢。 最佳答案 是的,您可以使用外部jar运行MR作业。请务必在提交作业时向HADOOP_CLASSPATH和-libjars添加任何依赖项,如以下示例所示:您可以使用以下命令添加当

database - 创建 Hive Metastore 数据库表错误

我正在运行ClouderaManager(免费版),我到达了向导创建HiveMetastore数据库的地步。显示此错误并停止配置过程。使用/var/run/cloudera-scm-agent/process/40-hive-metastore-create-tables/hadoop-conf作为HADOOP_CONF_DIR我似乎找不到任何可能导致此问题的信息?到目前为止,一切都已正确配置,安装的一切以及用户名和密码都是正确的。有人以前见过这个错误吗?想法?错误日志:atsun.reflect.DelegatingConstructorAccessorImpl.newInstanc

hadoop - 如何在 EMR 上安装 cloudera impala?

无论如何,我是否可以安装唯一没有cloudera管理器和cdh的impala。我将使用hadoop的apache版本? 最佳答案 是的,这是绝对可能的。将存储库添加到您的sources.list文件中,然后更新存储库。deb[arch=amd64]http://archive.cloudera.com/impala/ubuntu/precise/amd64/impalaprecise-impala1contribdeb-srchttp://archive.cloudera.com/impala/ubuntu/precise/amd6

hadoop - 获取错误 {"RemoteException": {"exception" :"IllegalArgumentException" ,"javaClassName":

我在我的EC2实例上设置了CHD4。一切正常。当我尝试访问时:http://ec2-00-000-000-000.us-west-1.compute.amazonaws.com:50075/webhdfs/v1/?op=GETHOMEDIRECTORY我遇到以下错误:{"RemoteException":{"exception":"IllegalArgumentException","javaClassName":"java.lang.IllegalArgumentException","message":"namenoderpcaddressisnotspecified."}}我什至

hadoop - CDH4 : Version conflict: Found interface org. apache.hadoop.mapreduce.Counter,但类是预期的

我正在尝试从CDH3升级到CDH4,但从编译到运行时遇到版本冲突。我收到此错误:线程“主”java.lang.IncompatibleClassChangeError中的异常:找到接口(interface)org.apache.hadoop.mapreduce.Counter,但类是预期的从谷歌搜索看来,我的代码是针对Hadoop1.x编译的,并在Hadoop2.0上运行。我正在同一个Hadoop客户端上编译和运行该应用程序,因此它应该都是Hadoop2.0。这是我在客户端或此测试集群中的任何其他节点上运行“hadoop版本”所获得的结果:Hadoop2.0.0-cdh4.4.0颠覆文

hadoop - 使用 tHDFSPut 的简单 Talend 作业因连接被拒绝而失败

我创建了一个Talend作业,使用tHDFSPut将一个简单的文本文件(webapp.log,50KB)上传到HDFS。目录和文件已在HDFS中成功创建,但在上传文件内容期间,我以某种方式重现了Connectionrefused:nofurtherinformation(请参阅末尾的日志),因此上传失败(即创建的文件保持为空)。HDFS在ClouderaQuickstartVM中运行。tHDFSComponent中的用户名设置为“cloudera”并且应该可以工作,因为它是默认配置的一部分。对于为什么我收到“连接被拒绝”有什么建议吗?我尝试了什么ClouderaManager表示服务h

hadoop - 运行 WordCount v1.0 示例时 part-00000 中没有输出

我是Cloudera和Hadoop的新手,ClouderaWordCount1.0示例(part-00000)的输出为空。我使用的步骤和文件是here.我想提供任何有帮助的工作日志信息,同上版本-我只需要一些关于在哪里可以找到它们的指导。以下是作业输出和来源。在写入的其他部分(part-00001到part-00011)中,非空部分是part-00001(再见1)、part-00002(Hadoop2)、part-00004(再见1)、part-00005(世界2),和part-00009(你好2)。任何帮助都会很棒。命令和输出如下:[me@server~]$hadoopfs-cat/

java - 将文件从 HDFS 复制到 Windows 机器时出错

有一个安装并运行着Hadoop的Linux虚拟机。在Eclipse中运行的Java应用程序可以从HDFS检索数据。如果我在VM内将文件复制到HDFS或从HDFS复制文件,一切正常。但是当我从我的Windows物理机上运行该应用程序时,我遇到了下一个异常:WARNhdfs.DFSClient:Failedtoconnectto/127.0.0.1:50010forblock,addtodeadNodesandcontinue.java.net.ConnectException:Connectionrefused:nofurtherinformation.CouldnotobtainBP-