草庐IT

hadoop - 创建用于在 Hadoop 1.2.1 上运行 MapReduce 的 jar

我是Hadoop的新手,我刚刚在我的Mac笔记本电脑(Mavericks)上安装了Hadoop1.2.1。然后,我在IntelliJIDEA中创建了一个简单的WordCount项目,并能够在虚拟文本文件上运行代码。我在成功创建一个jar文件时遇到了麻烦,该文件将通过IDE复制我的执行。我收到以下错误:java-jar./out/artifacts/WordCount_jar/WordCount.jartest.txtout[19:35:21]Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/commons/

java - Hadoop 外部 jar

我正在尝试在服务器上运行hadoop作业。版本是0.20.2。我有很多jar,我正在运行:hadoopjarGenData.jar-libjars/path/jar1,path/jar2,...即使相应的类在jars中,我也会收到以下错误:Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/avro/mapreduce/AvroKeyInputFormatatGenerateTrainningData.main(GenerateTrainningData.java:256)atsun.reflect.Nati

java - tools.jar 的文件位置?

我正在尝试在我的iMac10.9.5上配置单节点Hadoop环境。这比我预期的要痛苦得多,我要感谢Java。过去两个小时我一直在处理这个问题。Error:Couldnotfindorloadmainclasscom.sun.tools.javac.Main我查看了JDK8文档和大量论坛来寻找原因,并将其缩小到两个。当我安装JDK8时,出了点问题,它没有包含在安装中。无论出于何种原因,tools.jar都没有达到JAVA_HOME的距离。这将需要找出Java8中tools.jar的路径并链接到JAVA_HOME,我一直找不到。我真的很想更好地了解出了什么问题以及原因。此外,tools.j

hadoop - 对于 oozie,如何使用 hadoop 1.3 让用户 jar 优先于 hadoop jar

我正在使用hadoop1.3和oozie。我的java操作引用了一个方法commons-collection1.7。这在以前的版本中不存在。该jar是一个包含所有类的胖jar,我将其放在工作流程下的lib文件夹中。OOzie在启动时我的提交操作引用了类路径上的旧hadoopjar,而不是给予用户jar优先级。有什么办法可以优先考虑用户jar吗?oozie.launcher.mapreduce.task.classpath.user.precedence=true将不起作用,因为这是hadoop1.3而不是hadoop2。 最佳答案

java - Hive Java API 注册 jar

我正在使用Cloudera5.3.1并使用相应的HiveAPI我能够通过Java进行一些查询。但是,我的一些查询需要一些UDF,我为其添加了jars。我已经从.hiverc添加了jar,hive命令行很好地使用了它。但是,Java在从JavaAPI调用时不使用jars。我在以下类路径中添加了jars但没有用:-/opt/cloudera/parcels/CDH/lib/hive/lib/看起来hive没有将上面的作为类路径。现在我正在执行Hiveql查询来为每个语句单独添加jars:-stmt.execute("addjarhdfs:///user/hive/aux_jars/open

java - JAR Maven 项目依赖远程机器没有依赖

我是Maven和Java的新手。我正在尝试在远程机器上运行hdfsMapReduce作业。我没有编写/编辑依赖文件的权限。我想知道是否可以JAR我的Maven项目并将其传递给我的MapReduce作业。这样我就不需要通过SSH连接到远程机器并更改Maven项目依赖项。我会使用包含远程计算机上未包含的所有必需依赖项的JAR来运行我的MapReduce作业。 最佳答案 您可以使用mavenassemblyplugin来做到这一点.将其添加到您的POM并进行相应配置(请查看下面的示例)。这将创建一个额外的jar,其中包含从命令行运行jar

java - 是否可以使用不同版本的 java 运行 jar 文件?

因此,我们在PowerPC机器(64位)上运行hadoop。它使用IBMJDK运行。但是,在该hadoopmapreduce程序中,会生成不同的进程(使用ProcessBuilder类)来执行jar程序。问题是这些程序在IBMJDK的虚拟机上运行有问题,因此需要OpenJDK。同样,hadoop在PowerPC上与OpenJDK一起运行时也会出现问题。所以我想知道,是否可以使用不同版本的java执行jar文件。因此,例如,在这种情况下,hadoop使用IBMJDK,而在mapreduce程序中执行的jar文件使用OpenJDK。基本上,我们需要为同时运行的程序使用不同的java虚拟机。

java - 如何将 fat jar 用于不同的色调工作流程

我的意图是通过调用其不同的主类,将一个fatjar用于许多不同的hue管理的oozie作业。如果我像这样将它放在每个相应的工作流目录中,一切都会正常工作:/user/hue/oozie/workspaces/hue-oozie-1439883696.08/myJobs.jar但我不知道我应该把它放在哪里,所以所有的工作流程都可以访问它。总是收到java.lang.ClassNotFoundException,因为oozie找不到jar。/user/hue/oozie/workspaces/workflows/jobname/lib/myJobs.jar看起来很有前途,但似乎也不对。

hadoop - 我可以在 HDInsight 的 lib 文件夹下运行包含另一个 JAR 文件的 JAR 文件吗?

是否可以在HDInsight中运行包含lib文件夹下的另一个JAR文件的JAR文件?JAR文件├/folder1/subfolder1/myApp/…│〉〈〉└.class文件||└lib/dependency.jar//库(jar文件)谢谢! 最佳答案 在HDInsight上,我们应该能够运行JavaMapReduceJAR,它依赖于另一个JAR。有几种方法可以做到这一点,但通常不是通过复制头节点上lib文件夹下的第二个JAR。原因是——根据依赖所在的位置,您可能需要将JAR复制到所有工作节点和头节点的lib文件夹下——成为一项繁

xml - HDP 沙盒上的 Hive ADD JAR

我需要将XML存储在HDFS中并在该HDFS文件夹之上创建配置单元表。我一直在尝试使用此link中提供的那个从link下载后,我已将serdejar添加到配置单元中使用添加jar命令。ADDJARhivexmlserde-1.0.5.3.jar我还收到消息“已添加到类路径”listjars也证实了这一点。但是当我尝试创建相同的link中提到的表时,它失败并显示以下消息FAILED:SemanticExceptoncannotfindclasscom.ibm.spss.hive.serde2.xml.XmlInputFormat请帮忙。注意:我使用的是HDP2.3附上结果截图。