草庐IT

uber-jar

全部标签

java - Job提交前如何分发jar到hadoop

我想实现RESTAPI来提交Hadoop作业以供执行。这完全是通过Java代码完成的。如果我编译一个jar文件并通过“hadoop-jar”执行它,一切都会按预期进行。但是当我在我的RESTAPI中通过Java代码提交Hadoop作业时-作业已提交但由于ClassNotFoundException而失败。是否可以以某种方式将jar文件(使用我的作业代码)部署到hadoop(nodemanagers及其容器),以便hadoop能够按类名定位jar文件?我应该将jar文件复制到每个节点管理器并在那里设置HADOOP_CLASSPATH吗? 最佳答案

hadoop - 在 Hadoop 集群中为 MapReduce 作业部署 JAR

抱歉这个愚蠢的问题。我在CentOSlinux中有一个5节点的hadoop集群。名称节点/职位追踪器/二级名称节点/数据节点-2我写了一个mapreduce并编译了JAR。我需要将JAR部署到哪个节点?提前致谢。 最佳答案 在一个典型的hadoop集群中,应该有客户端节点。客户端节点用于在hadoop集群上运行客户端应用程序和集群管理工具。客户端机器执行以下任务:在HDFS集群中加载数据提交MapReduce作业(描述如何处理数据)在作业完成后检索或查看作业结果提交Pig或Hive查询Hadoop管理员通常在安装和配置hadoop集

hadoop - AWS EMR 4.0 - 如何添加自定义 JAR 步骤以运行 shell 命令

我正在尝试使用EMR4.0.0上的步骤运行shell命令,并使用此链接作为引用-http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-hadoop-script.html但我想知道从何处将“command-runner.jar”放入“JAR位置”字段http://i.stack.imgur.com/CRicz.png我在AWSs3中保留了“command-runner.jar”并尝试从该位置加载它,在“参数”中给出了我的“example.sh”文件的s3位置,在添加步骤后它失败并给出了这个异常Exce

maven - 需要将 flink-hadoop-compatibility-2.10 jar 显式复制到 EMR 集群上的 ${FLINK-HOME}/lib 位置

我目前正在开发一个Flink应用程序,该应用程序使用一些Hadoop依赖项将数据写入S3位置。在本地环境中它运行良好,但是当我在EMR集群上部署这个Flink应用程序时,它抛出了与兼容性问题相关的异常。我得到的错误信息是java.lang.RuntimeException:无法加载类“org.apache.hadoop.io.Writable”的TypeInformation。您可能缺少“flink-hadoop-compatibility”依赖项。在org.apache.flink.api.java.typeutils.TypeExtractor.createHadoopWritab

Hadoop 找不到示例 jar 文件

我正尝试按照HadoopInAction中的说明以伪分布式模式运行它。它在我使用本地/独立模式时运行。现在好像找不到jar文件的路径cd$HADOOP_HOMEjps17559JobTracker17466SecondaryNameNode17791TaskTracker16993NameNode17942Jpsbin/hadoophadoop-examples-1.0.3.jarwordcountWarning:$HADOOP_HOMEisdeprecated.Exceptioninthread"main"java.lang.NoClassDefFoundError:hadoop-e

hadoop - HDInsight hadoop-mapreduce-examples.jar 输出在哪里?

我在HDInsight中运行示例wordcount应用程序命令成功运行,但我找不到输出。我运行的命令是hadoopjarhadoop-mapreduce-examples.jarwordcount/example/data/gutenberg/davinci.txt/user/joe/WordCountOutput我期待在文件系统上创建一些东西。但我没有看到/user/joe/创建。请指教。 最佳答案 默认情况下,HDInsight使用Azureblob存储作为其HDFS存储,因此您的输出位于与集群关联的存储帐户中。你可以使用类似C

java - 带有 gradle 的 groovy hadoop jar - 包不存在错误

我试图用Gradle2.12创建一个groovyjar。groovy文件有如下导入语句,我把这个文件放在src/main/groovy前两个import是java文件,里面有org.apache.hadoopimports语句。我把这两个文件放在src/main/javaimportStartsWithCountMapperimportStartsWithCountReducerimportorg.apache.hadoop.conf.Configuredimportorg.apache.hadoop.fs.Pathimportorg.apache.hadoop.io.IntWrita

java - 在 Hortonworks 沙箱中流式传输 Hadoop jar 文件,没有 contrib 目录

我正在hortonworks沙箱中演示hadoopvirtualmachine.我之前在EC2上设置了简单的elasticmapreduce流作业,遵循patterns喜欢this,或this.但是,我似乎没有安装流媒体jar——事实上,我似乎缺少许多所需的基本目录:$HADOOP_HOME/mapred/contrib/我的ls-lah实际上是这样的:[root@sandbox~]#ls-lahtotal60Kdr-xr-x---.5rootroot4.0KApr1018:52.dr-xr-xr-x.24rootroot4.0KApr1018:31..-rw-------1rootr

hadoop - 运行 Apache Pig 脚本时如何查找 jar 依赖项?

我在运行一个简单的pig脚本以使用HBaseStorage将数据导入HBase时遇到了一些困难我遇到的错误是:Causedby:pigscriptfailedtovalidate:java.lang.RuntimeException:couldnotinstantiate'org.apache.pig.backend.hadoop.hbase.HBaseStorage'witharguments'[rdf:predicaterdf:object]'Causedby:java.lang.NoSuchMethodError:org.apache.hadoop.hbase.client.Sc

hadoop - 你可以用 hadoop-mapreduce-examples-2.2.0.jar 做什么?

关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗?通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion我是Hadoop的新手,想了解安装时附带的jar文件。我一直在使用hadoop-mapreduce-examples-2.2.0.jar运行wordcount测试。一切进展顺利,但我想知道除了wordcount之外,我还能用这个jar文件或其他可用的jar文件做什么?