草庐IT

macos - 找不到 pig-core-h2.jar。执行 'ant -Dhadoopversion=23 jar' ,然后重试

我下载了pig0.14.0,我在MACOSX上运行Hadoop2.6.0。我在https://github.com/ucbtwitter/getting-started/wiki/Installing-Pig遵循了PIG的所有安装步骤。.我已经如前所述正确设置了JAVA_HOME。即使在运行ant“-Dhadoopversion=23jar”命令后,我仍收到相同的错误“找不到pig-core-h2.jar。执行‘ant-Dhadoopversion=23jar’,然后重试”。 最佳答案 这个错误不断出现找不到pig-core-h2.

java - 打开作业 jar : file in hdfs 时出错

我一直在尝试修复这个问题,但不确定我在这里犯了什么错误!你能帮我解决这个问题吗?非常感谢!我的程序:打包hadoopbook;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.IntWritable;importorg.apache.hadoop.io.LongWritable;importorg.apache.hadoop.io.Text;importorg.apache.hado

java - import org.apache.hadoop 无法解析

我已经看到这个问题,但似乎没有任何修复对我有用。或者更有可能是我做错了,因为我对此很陌生。(在eclipse中工作)我收到以下行的错误Theimportorg.apache.hadoopcannotberesolved:importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.filecache.DistributedCache;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;importorg.apache.hadoo

hadoop - HIVE:UDF 错误失败:找不到类 <ClassName>

我正在尝试使用myjar.jar作为HIVE中的UDF函数,如下所示,echo"Addmyjar.jar"$HIVE_HOME/bin/hive-e"ADDJAR/gpfs/user/username/HIVE/myjar.jar;"echo"Listmyjar.jar,thisisshowinglocaldirectorypath"$HIVE_HOME/bin/hive-e"listjar;"$HIVE_HOME/bin/hive-e"dropfunctionifexistsmyfunction;"echo"Createtemporaryfunction,myclassnameisU

hadoop - vertica jar

我正在尝试将数据从Vertica传输到Hive。根据手册,应将以下设置为输入格式:-inputformatcom.vertica.hadoop.deprecated.VerticaStreamingInput但是hadoop-verticajar有org.apache.hadoop.vertica.VerticaStreamingInput类而不是上面的类。所以它抛出以下异常:Exceptioninthread"main"java.lang.RuntimeException:classorg.apache.hadoop.vertica.VerticaStreamingInputnoto

hadoop - 使用 Yarn 客户端在 Google Cloud 上的 Hadoop 中运行 JAR

我想使用Yarn客户端在GoogleCloud上的Hadoop中运行一个JAR。我在hadoop的master节点使用这个命令spark-submit--classfind--masteryarn-clientfind.jar但它返回这个错误15/06/1710:11:06INFOclient.RMProxy:ConnectingtoResourceManagerathadoop-m-on8g/10.240.180.15:803215/06/1710:11:07INFOipc.Client:Retryingconnecttoserver:hadoop-m-on8g/10.240.180

java - Hadoop项目启动时需要的JAR有哪些?

这一定看起来像是一个愚蠢的问题,但我是Hadoop的新手并且正在尝试运行一个简单的示例。但是,我一直遇到JAR文件的问题并且似乎没有正确的导入。我正在使用clouderaCDH4,它有很多JAR文件可供选择,每个文件都有多个版本。因为我刚刚开始,所以无法区分。目前我得到这个异常(exception):Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/commons/configuration/Configurationatorg.apache.hadoop.metrics2.lib.DefaultMetri

java - 使用hadoop jar时如何增加堆大小?

我正在使用hadoopjar命令运行一个程序。但是,为了使该程序运行得更快,我需要增加Hadoop的堆大小。我尝试了以下方法,但它没有任何效果(我有hadoop版本2.5),即使在同一个终端上也是如此。exportHADOOP_HEAPSIZE=16384exportHADOOP_OPTS="-Xmx16g"我认为的另一种方法是将以下内容添加到mapred-site.xml文件中,但不幸的是我不是管理员,所以不能这样做。mapred.child.java.opts-Xmx16384m还有其他方法吗? 最佳答案 我通过修改HADOOP

Java编译不产生.jar

我已经创建了简单的“WordCount.java”文件来实现一个简单的hadoop程序,并且在编译时,它不会创建一个.jar文件。在WordCount.class、WordCount$Map.class和WordCount$Reduce.class中创建的文件。我查看了WordCount.java文件,它确实包含一个publicstaticvoidmain(String[]args)例程,所以它应该创建一个.jar文件,对吧?这是我很长一段时间以来第一次接触Java,因此很容易在Java的编译方式上出错,但是给定以下代码,它不应该在正确编译后给我一个.jar文件吗?packageorg

java - Hadoop Mapreduce 字数统计

从EclipseKepler运行HadoopMapReduceWordCount程序与使用位于Mapreduce(hadoop-mapreduce-example-2.6.0.jar)中的预定义jar文件运行它有什么区别。在速度、性能等方面有什么区别吗? 最佳答案 没有区别。只是当你的输入很大并且你有mapper/reducer在多个节点上运行时,你会看到显着的性能提升,因为现在字数统计将在不同的机器上并行完成。 关于java-HadoopMapreduce字数统计,我们在StackOv