uber-jar_草庐IT

hadoop - Hadoop中使用的jar文件重新编译后是否需要停止所有作业

我的问题是假设我正在对MapReduce过程中使用的一个jar文件进行更改，如果我想重新编译这个jar并使更新后的jar工作，我是否必须停止所有hadoop首先服务，然后重新编译并重新启动所有服务？如果是，请解释。最佳答案不，我经常这样做。只需重新编译jar并运行新作业即可。关于hadoop-Hadoop中使用的jar文件重新编译后是否需要停止所有作业，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.c

java - 如何为从配置单元 jdbc 查询启动的 mr 作业指定额外的 jar？

我正在尝试通过使用avro存储格式的jdbc查询一个配置单元表，但我在查询产生的mr作业中收到一个类未找到错误。奇怪的是，我可以从配置单元shell运行查询而不会发生异常。我可以运行一个不生成mapreduce作业的查询(select*fromtablelimit10)并且它工作正常。2014-03-1210:23:34,040WARN[main]org.apache.hadoop.mapred.YarnChild:Exceptionrunningchild:java.io.IOException:java.lang.reflect.InvocationTargetExceptiona

配置单何为 java apache hadoop jdbc hive avro

Hadoop 独立安装 - java.net.ConnectException : Connection refused error while running jar

我是Hadoop的新手，我试图在Ubuntu14.04中安装单节点独立Hadoop。我正在关注ApacheHadoopDocument正如那里给出的那样，当我尝试运行时$bin/hadoopjarshare/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jargrepinputoutput'dfs[a-z.]+'我收到了java.net.ConnectException消息:CallFroma1409User/127.0.0.1tolocalhost:9000failedonconnectionexception:java.net.C

ConnectException Connection hadoop code section

java - 不是来自测试 hadoop mapreduce wordcount 的有效 JAR

HadoopMapreduce的新手，我不确定为什么会收到此错误。我目前得到:NotavalidJAR:/nfsdata/DSCluster/home/user/bli1/wordcount/wc.jar这是我的过程:HDFS文件结构:/bli1/wordcountwc.jarWordCount.java/inputfile01/outputfile02在本地机器上创建WordCount.java和wc.jar与jarcfwc.jarWordCount.java在本地机器上创建file01和file02创建/input和/output/wordcount内的目录在hdfs中使用hdfs

mapreduce wordcount code section java hadoop jar

hadoop - elephant-bird-pig-JsonLoader() 所需的 jar

使用elephant-bird-pig-JsonLoader函数需要注册哪些jar？最佳答案我指着一些jar。注册'elephant-bird-pig-4.1.jar';注册'elephant-bird-core-4.1.jar';注册'elephant-bird-hadoop-compat-4.1.jar'; 关于hadoop-elephant-bird-pig-JsonLoader()所需的jar，我们在StackOverflow上找到一个类似的问题：

elephant-bird-pig-JsonLoader JsonLoader section elephant bird hadoop elephantbird

hadoop - 如何找到运行我的工作的确切 hadoop jar 命令？

我正在使用CDH5.4。我正在运行一个从命令行看起来没问题的hadoop作业(当简单地使用hadoopjar运行时)。但是，如果我从yarn运行它，它会以单个映射器和没有缩减器静默完成。我真的怀疑这两个“运行”都在运行完全相同的命令。但是，我想确定这一点。所以我查看日志:(请注意它是一个使用自定义运行器的烫伤工作-当我从命令行运行它时一切正常)。/container_1432733015407_0953_01_000001/container_1432733015407_0953_01_000001/user/stdout/?start=0我看到了类似的东西:Mainclass:org

hadoop 确切 code section hadoop-yarn oozie cascading scalding

scala - 如何在 hadoop 上使用 Spark 启动 Jar 文件

我正在安装hadoop的GoogleCloudPlatform上做一个项目。我在scala中编写了一个程序，并使用sbt的汇编指令创建了一个可执行JAR现在我必须上传并在我的平台上运行它。我尝试使用命令spark-submit--class"Hi"provaciao.jar但即使它在sparkstandalone上本地工作，我也会收到错误消息。我用的是spark的1.1.0版本，hadoop的2.4版本这是我的错误日志marooned91_gmail_com@hadoop-m-on8g:/home/hadoop/spark-install/bin$spark-submit--class

何在 hadoop java URLClassLoader section scala apache-spark google-cloud-platform

java - 如何从另一个程序运行 hadoop jar？

我需要实现以下功能:publicvoidCreateMRJob(StringjobInputLocation,StringjobJarLocation);这可能看起来相当简单并且是一个重复的问题，但我想在一个单独的文件(WPMampReduce.java如下附件)中执行作业的初始化，因为用户将被允许编辑它的某些部分。这就是我所说的在单独的文件中初始化作业的意思://WPMapReduce.javapublicclassWPMapReduce{publicstaticvoidmain(String[]args)throwsException{Configurationconf=newCo

hadoop java job section class jobs

java - Docker 和 Cloudera 快速入门 : How to run own jar-file?

我安装了Docker容器并进行了后续步骤:dockerpullcloudera/quickstart:latestdockerimages#notethehashoftheimageandsubstituteitbelowdockerrun--privileged=true\--hostname=quickstart.cloudera\-t-i${HASH}\/usr/bin/docker-quickstart所以，现在我知道了:Cloudera正在运行。但是我看不到任何本地文件，那么如何加载我自己的文件，尤其是jar文件以使用Hadoop运行它？最佳答案

Cloudera jar-file section docker quickstart java hadoop bigdata

java - 使用 Cloudera 5.14 和 Spark2 : Livy can't find its own JAR files 配置 Livy

我是Cloudera的新手，正在尝试将工作负载从运行Ambari和Livy和Spark2.2.x的HDP服务器转移到具有类似设置的CDH5服务器。由于Livy不是Cloudera的组件，我使用的是他们网站上的0.5.0-incubating版本，在与YARN、Spark和HDFSmasters相同的服务器之一上运行它。长话短说，当我尝试提交给Livy时，我收到以下错误消息:Diagnostics:Filefile:/home/livy/livy-0.5.0-incubating-bin/rsc-jars/livy-rsc-0.5.0-incubating.jardoesnotexist

Livy Cloudera java code apache-spark hadoop