草庐IT

hadoop - 使用不同的 hadoop-mapreduce-client-core.jar 运行 hadoop 集群

我在安装了CDH4.2.0的hadoop集群上工作并遇到了this错误。它已在更高版本的hadoop中得到修复,但我无权更新集群。有没有办法告诉hadoop在通过命令行参数运行我的工作时使用这个jarhadoopjarMyJob.jar-Dhadoop.mapreduce.client=hadoop-mapreduce-client-core-2.0.0-cdh4.2.0.jar新的mapreduce-client-core.jar文件是票证中的补丁jar。或者必须用这个新的jar完全重新编译hadoop?我是hadoop的新手,所以我不知道所有可能的命令行选项。

Hadoop 预装示例 Jars

我刚刚在本地机器上成功设置了Hadoop。我正在关注我刚买的一本畅销书中的一个例子。我正在尝试获取安装附带的所有hadoop示例的列表。为此,我键入以下命令:bin/hadoopjarhadoop-*-examples.jar输入此内容后,我应该会得到一个Hadoop示例列表,对吗?然而,我所看到的只是这条错误信息:NotavalidJAR:/home/user/hadoop/hadoop-*-examples.jar我该如何解决这个问题?这只是一个简单的权限问题吗? 最佳答案 这很可能是配置问题或使用了无效的文件路径。很可能had

java - 使用命令行在 Windows 中的 hadoop 上运行 wordcount.jar

我试图在hadoop上运行一个简单的wordcount程序,但遇到如下错误。Exceptioninthread"main"java.io.IOException:Erroropeningjobjar:/user/asiapac/bmohanty6/wordcount/wordcount.jaratorg.apache.hadoop.util.RunJar.main(RunJar.java:90)Causedby:java.io.FileNotFoundException:\user\asiapac\bmohanty6\wordcount\wordcount.jar(Thesystemc

hadoop - HDP2.0 for hbase 中缺少安全 jar

我们已将集群从HDP1.3升级到HDP2.0。由于这次迁移,我们以前工作的代码面临某些问题。使用Importtsv命令批量加载Hbase:HDP1.3中存在的安全jar在HDP2.0中缺失。因此,我们无法正确映射jars。在1.3集群中工作的Pig命令过滤器在2.0中不工作。我们如何解决这个问题? 最佳答案 Hadoop提供了良好的向后兼容性。确保集群中的每个节点(所有Hadoop服务)都从1.3升级到2.0,包括Pig、Hive、HBase、Sqoop.... 关于hadoop-HDP

hadoop - 命令 'hadoop jar' 不采用 -Dfile.encoding=UTF-8?

考虑以下用于map-reduce作业的主类:publicclassAppextendsConfiguredimplementsTool{publicstaticvoidmain(String[]args)throwsException{ToolRunner.run(newApp(),args);}@Overridepublicintrun(String[]args)throwsException{System.out.println(Charset.defaultCharset().toString());return0;}}在交互式shell中使用时,它输出“UTF-8”。在cron

java - 在同一程序中处理 2 个版本的 hadoop 时,Hadoop jar 冲突问题

以下是我们目前遇到的Hadoop不兼容问题。用例我们正在从在新Hadoop(版本2.2.0.2.0.6.0-101[Hortonworks])上运行的HBASE(版本0.96.1.2.0.6.1-101-hadoop2)读取/扫描并写入旧Hadoop(版本0.20.2+320[Cloudera])使用JAVA程序。但是,由于2个Hadoop版本之间的不兼容,我们遇到了异常。下面的代码片段抛出一个异常:privateHbaseConfigFactory(StringclusterUri,StringhbaseRootdir)throwsException{factoryImpl=HBas

hadoop yarn 类未在同一个 jar 中找到,但在运行作业期间包不同

我以“Hadoop:权威指南2/e”一书为例。我遇到了一个问题..:-(。我用的是ubuntu12.04,hadoop2.2.0。我使用eclipse制作了job.jar。map_reduce.programming.v1.MaxTemperatureReducer类在jar中,但包不同。当我运行作业时,我遇到类未找到异常。下面是ma​​pred-site.xmlmapreduce.framework.nameyarn如果将值更改为local而不是yarn,它会起作用。但如果是yarn,则不起作用。HADOOP_CLASS_PATH包括包含job.jar的路径。根本原因是什么?pack

java - Hadoop MapReduce 程序在 Eclipse 中运行良好,但在导出到 .jar 文件时运行不佳

在Eclipse中,我从三个目录添加外部库。hadoop中的lib目录,hbase中的lib目录和我的Eclipse项目中的两个本地目录以及其他jar。执行导出的jar文件时,我得到一个与hbase相关的ClassNotFoundException。我确定这是我的外部库的问题。我就这样执行程序:hadoopjar/home/brunneis/Escritorio/mr.jarPrincipal-libjars/bigdata/hbase/lib/*.jar,/home/brunneis/workspace/MapReduce/lib/*.jar,/home/brunneis/works

java - streaming jar 找不到 HDFS 中的 Mapper 文件

我目前正在尝试让本地版本的Hadoop运行,但我有点卡住了。我使用以下教程进行设置:http://glebche.appspot.com/static/hadoop-ecosystem/hadoop-hive-tutorial.html现在,我想使用本教程执行一个简单的Mapreduce:http://www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/但是,我似乎对HDFS有一些问题,因为当我想运行以下命令时::libexecme$hadoopjar./share/hadoop/to

java - 使用 Hadoop Jar 的垃圾收集信息

有没有办法在使用hadoop运行jar文件时看到垃圾收集信息?例如:$hadoopjartest.jar我尝试用上面的命令标记-verbose:gc但它没有用。 最佳答案 Hadoop隐藏了Java调用,你可以尝试使用:$exportHADOOP_CLIENT_OPTS="-Xloggc:gc.log"$hadoopjartest.jar希望对你有帮助 关于java-使用HadoopJar的垃圾收集信息,我们在StackOverflow上找到一个类似的问题: