草庐IT

hadoop - elephant-bird-pig-JsonLoader() 所需的 jar

使用elephant-bird-pig-JsonLoader函数需要注册哪些jar? 最佳答案 我指着一些jar。注册'elephant-bird-pig-4.1.jar';注册'elephant-bird-core-4.1.jar';注册'elephant-bird-hadoop-compat-4.1.jar'; 关于hadoop-elephant-bird-pig-JsonLoader()所需的jar,我们在StackOverflow上找到一个类似的问题:

hadoop - 如何找到运行我的工作的确切 hadoop jar 命令?

我正在使用CDH5.4。我正在运行一个从命令行看起来没问题的hadoop作业(当简单地使用hadoopjar运行时)。但是,如果我从yarn运行它,它会以单个映射器和没有缩减器静默完成。我真的怀疑这两个“运行”都在运行完全相同的命令。但是,我想确定这一点。所以我查看日志:(请注意它是一个使用自定义运行器的烫伤工作-当我从命令行运行它时一切正常)。/container_1432733015407_0953_01_000001/container_1432733015407_0953_01_000001/user/stdout/?start=0我看到了类似的东西:Mainclass:org

scala - 如何在 hadoop 上使用 Spark 启动 Jar 文件

我正在安装hadoop的GoogleCloudPlatform上做一个项目。我在scala中编写了一个程序,并使用sbt的汇编指令创建了一个可执行JAR现在我必须上传并在我的平台上运行它。我尝试使用命令spark-submit--class"Hi"provaciao.jar但即使它在sparkstandalone上本地工作,我也会收到错误消息。我用的是spark的1.1.0版本,hadoop的2.4版本这是我的错误日志marooned91_gmail_com@hadoop-m-on8g:/home/hadoop/spark-install/bin$spark-submit--class

java - 如何从另一个程序运行 hadoop jar?

我需要实现以下功能:publicvoidCreateMRJob(StringjobInputLocation,StringjobJarLocation);这可能看起来相当简单并且是一个重复的问题,但我想在一个单独的文件(WPMampReduce.java如下附件)中执行作业的初始化,因为用户将被允许编辑它的某些部分。这就是我所说的在单独的文件中初始化作业的意思://WPMapReduce.javapublicclassWPMapReduce{publicstaticvoidmain(String[]args)throwsException{Configurationconf=newCo

java - Docker 和 Cloudera 快速入门 : How to run own jar-file?

我安装了Docker容器并进行了后续步骤:dockerpullcloudera/quickstart:latestdockerimages#notethehashoftheimageandsubstituteitbelowdockerrun--privileged=true\--hostname=quickstart.cloudera\-t-i${HASH}\/usr/bin/docker-quickstart所以,现在我知道了:Cloudera正在运行。但是我看不到任何本地文件,那么如何加载我自己的文件,尤其是jar文件以使用Hadoop运行它? 最佳答案

java - 使用 Cloudera 5.14 和 Spark2 : Livy can't find its own JAR files 配置 Livy

我是Cloudera的新手,正在尝试将工作负载从运行Ambari和Livy和Spark2.2.x的HDP服务器转移到具有类似设置的CDH5服务器。由于Livy不是Cloudera的组件,我使用的是他们网站上的0.5.0-incubating版本,在与YARN、Spark和HDFSmasters相同的服务器之一上运行它。长话短说,当我尝试提交给Livy时,我收到以下错误消息:Diagnostics:Filefile:/home/livy/livy-0.5.0-incubating-bin/rsc-jars/livy-rsc-0.5.0-incubating.jardoesnotexist

java - 使用 Eclipse 将所有外部类打包到我的 jar 中

我正在Eclipse中开发一个Hadoop项目,该项目依赖于我的另一个项目;我已将其他项目包含在我的构建路径中,但是当我导出依赖项目时,它只包含来自同一项目的类。通常,这不会成为问题,因为我可以使用-cp标志链接其他项目,但Hadoop要求您将jar作为参数传递,这意味着我的所有依赖项都必须在该jar中。有没有办法在Eclipse中自动构建和包含您所依赖的项目中的类?谢谢。 最佳答案 你可以使用Ant自动构建、测试和导出。它需要一些时间来学习它,但它是值得的。有可能的任务(文件集、zipgroupfileset、复制)将文件、jar

hadoop - 从 CDH4 jar 文件构建 Hadoop Ecplise 库

我正在尝试构建一个包含在Eclipse中构建map/reduce作业所需的所有jar文件的Hadoop库。在Ubuntu上安装Hadoop时,我需要哪些.jar文件以及从单节点安装CDH4的哪些文件夹? 最佳答案 假设您已经从https://ccp.cloudera.com/display/SUPPORT/CDH4+Downloadable+Tarballs下载了CDH4tarball发行版解压缩tarball在解压后的目录中找到build.properties文件:hadoop-2.0.0-cdh4.0.0/src/hadoop-

java - 如何捆绑自定义 hadoop-streaming.jar

我正在尝试通过Yelp的EMRMrJob工具使用CombineFileInputFormat类。作业流是使用hadoop流创建的,MrJob的文档指出CombineFileInputFormat类必须捆绑在自定义的hadoop-streaming.jar中。有关上下文,请遵循此question.具体来说,我的问题是:具体类CombinedInputFormat.class应该在hadoop-streaming.jar中的什么地方被捆绑或引用?我尝试通过将CombinedInputFormat.class添加到目录org/apache/hadoop/streaming并执行来捆绑它:ja

java - 如何在 Cloudera hadoop 中使用外部 jar?

我的集群上安装了clouderahadoop版本4。它与googleprotobufferjar2.4版打包在一起。在我的应用程序代码中,我使用了使用protobuffer2.5版编译的protobuffer类。这会导致运行时无法解决的编译问题。有没有一种方法可以使用外部jar运行mapreduce作业,或者我会卡住直到cloudera升级他们的服务?谢谢。 最佳答案 是的,您可以使用外部jar运行MR作业。请务必在提交作业时向HADOOP_CLASSPATH和-libjars添加任何依赖项,如以下示例所示:您可以使用以下命令添加当