草庐IT

hadoop - pig - 包含多个 jar 的注册目录

我在本地模式下运行一个pig脚本,我可以注册包含jars的目录并且一切正常:register'/home/q/2/'在mapreduce模式下运行完全相同的脚本时,我收到如下错误:atorg.apache.pig.PigServer.storeEx(PigServer.java:1034)...15moreCausedby:java.io.FileNotFoundException:/var/tmp/home/q/2(Isadirectory)请问我如何在mapreduce模式下运行时注册目录? 最佳答案 尝试在本地或mapredu

java - 装 jar 顺序

假设类路径上有两个不同库版本的jar,例如java-cpA-2.1.jar:A-2.2.jar...第一个和第二个jar中的包名和类名相同,但类实现不同。是否指定rootjvmclassloader是否会在A-2.2之前尝试在A-2.1中寻找类?问题是AWSEMR将hadoopjar添加到类路径中,并且它的一些依赖项是旧版本的。但是,我们的应用程序需要使用相同库的新版本,因此在类路径前加上更新版本的库是否足够,或者在这种情况下是否推荐使用阴影?http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-ha

java - Hadoop Jar 运行但没有输出。 Driver、mapper 和 reduce 在 namenode 中编译成功

我是Hadoop编程的新手,我已经通过在三节点集群上设置Hadoop2.7.1开始学习。我试过在Hadoop中运行开箱即用的helloworldjar,它运行良好并成功,但我在本地机器上编写了自己的驱动程序代码并将其捆绑到一个jar中并以这种方式执行但它失败了,没有错误消息。这是我的代码,这就是我所做的。WordCountMapper.javapackagemot.com.bin.test;importjava.io.IOException;importorg.apache.hadoop.io.IntWritable;importorg.apache.hadoop.io.LongWri

hadoop - 无法运行象夫 jar

我正在执行命令为输入文件运行mahoutjar以生成输出文件。但我面临着几个错误。我已将输入文件放在hdfs中。命令是:mahoutrecommenditembased-sSIMILARITY_COOCCURRENCE-i/input.txt-o/output--booleanDatatrue我遇到了错误:MAHOUT_LOCALisnotset;addingHADOOP_CONF_DIRtoclasspath.Runningonhadoop,using/usr/lib/hadoop/bin/hadoopandHADOOP_CONF_DIR=/etc/hadoop/confMAHOUT

java - 方案 : hdfs when building fat jar in Spark; works fine in Eclipse mars 没有文件系统

当我用我的spark程序做一个fatjar然后我启动它时,我得到了这个错误:java-jar-myApp.jar[args]当我在Eclipse中运行我的应用程序时,它运行得非常好。这是我的POM:UTF-81.71.7org.apache.sparkspark-streaming-kafka_2.101.5.0org.apache.kafkakafka_2.100.9.0.1org.apache.sparkspark-streaming_2.101.6.1com.google.code.gsongson2.6.2org.apache.hadoophadoop-hdfs2.6.0org

java - 查找 hadoop-core-2.7.2.jar 路径

我是hadoop的新手,我正在尝试使用hadoop2.7.2版本运行使用hadoop1.2.1版本的代码。这是代码的一部分:MR_HADOOPJAR=/usr/local/hadoop/hadoop-1.2.1/hadoop-core-1.2.1.jarMR_MANIFEST=${rootPath}mp/src/manifest.txtecho"Compilingmpsourcecode.."javac-classpath$MR_HADOOPJAR${rootPath}mp/src/*.java可是,我找不到hadoop-core-2.7.2.jar??关于hadoop-core-2.

java - 使用参数运行我的 jar 时出错

我有一个用maven打包的spark应用程序。在运行时,我必须提供3个参数(创建RDD的3个文件的路径)。所以我使用spark-submit命令作为spark的官方网站指示:./bin/spark-submit\--class\--master\--deploy-mode\--conf=\..#otheroptions\[application-arguments]我的提交命令看起来像:\bin\spark-submit--classmyapp.Main--masterlocal[*]file:///C:\Users\pc\Desktop\eclipse\myapp\target\my

hadoop - 无法在 HUE oozie 中运行 spark 作业。异常 : "datanucleus-api-jdo-3.2.1.jar does not exist"

我想知道的是spark如何/在哪里挑选所需的jar。文件:/mnt/md0/yarn/nm/usercache/kylin/appcache/application_1468506830246_161908/container_1468506830246_161908_01_000001/datanucleus-api-jdo-3.2.1.jar不存在。--num-executors30--executor-memory18g--executor-cores15--driver-memory2g--fileshdfs:///jobs/kylin/hive-site.xml--jarsd

hadoop - 如何将 hadoop jar 添加到类路径?

我的mac上的Hadoop2.7.3安装在:/usr/local/Cellar/hadoop/2.7.3我写了一个demo来使用java从HDFS读取文件:importjava.io.*;importjava.net.URI;importjava.net.URISyntaxException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FSDataInputStream;importorg.apache.hadoop.fs.FSDataOutputStream;importorg.apach

eclipse - 为什么我把 "hadoop map/reduce"放到/eclipse/plugins里后找不到 "hadoop-eclipse-plugin-2.5.2.jar"?

我已经在Win10系统中安装了hadoop-2.5.2和eclipseneon.1a,但是我把“hadoop-eclipse-plugin-2.5.2.jar”放到/eclipse/plugins后,找不到“在eclipse中单击“windows”和“preferences”后,hadoopmap/reduce? 最佳答案 如果您只想“插入”一个新的插件,请将它放在eclipse/dropins文件夹中。否则,您应该使用P2正确安装它,或者至少使用-clean命令行参数启动Eclipse。