uber-jar

scala - 无法从 JAR 文件加载主类

我有一个Spark-scala应用程序。我试图显示一条简单的消息-“HellomyApp”。当我用sbtcompile编译它并用sbtrun运行它时，没问题。我成功显示了我的消息，但他显示错误；像这样:Hellomyapplication!16/11/2715:17:11ERRORUtils:uncaughterrorinthreadSparkListenerBus,stoppingSparkContextjava.lang.InterruptedExceptionERRORContextCleaner:Errorincleaningthreadjava.lang.Interrupte

python - 我的 boto elastic mapreduce jar 作业流参数有什么问题？

我正在使用boto库在Amazon的ElasticMapReduceWeb服务(EMR)中创建工作流。以下代码应创建一个步骤:step2=JarStep(name='Findsimiliaritems',jar='s3n://recommendertest/mahout-core/mahout-core-0.5-SNAPSHOT.jar',main_class='org.apache.mahout.cf.taste.hadoop.similarity.item.ItemSimilarityJob',step_args=['s3n://bucket/output/'+run_id+'/a

mapreduce elastic hadoop apache java python boto mahout amazon-emr

python - Windows 10 上的 Spark。 'Files\Spark\bin\..\jars"“\”未被识别为内部或外部命令

我对Spark感到非常沮丧。一个晚上都在想我做错了什么，但我已经卸载并重新安装了好几次，遵循了所有指示非常相似路径的多个指南。在cmd提示符下，我正在尝试运行:pyspark或spark-shell我遵循的步骤包括从以下位置下载预构建的包:https://spark.apache.org/downloads.html包括带有hadoop2.3的spark2.0.2和带有hadoop2.7的spark2.1.0。都不起作用，我收到此错误:'Files\Spark\bin\..\jars""\'isnotrecognizedasaninternalorexternalcommand,ope

别为 Spark section python windows hadoop apache-spark pyspark

hadoop - 如何从 HDFS 文件系统执行 hadoop jar？

我总是从本地文件系统执行作业，如下所示hadoopjar/home/usr/jar/myjar.jarcom.test.TestMain如何执行相同的命令，但myjar.jar将在hdfs中？有点像hadoopjarhdfs:///home/usr/jar/myjar.jarcom.test.TestMain但这当然行不通... 最佳答案 hadoopfs-copyToLocalhdfs:///home/usr/jar/myjar.jar/tmp/myjar.jar&&hadoopjar/tmp/myjar.jarcom.test.

hadoop HDFS section jar

java - 未设置作业 jar 文件。 Hadoop 中可能找不到用户类

我正在尝试运行MRwordcount作业。但我没有设置作业jar文件集。我正在发布堆栈跟踪，有人可以帮助我吗？14/01/2716:52:26WARNmapred.JobClient:UseGenericOptionsParserforparsingthearguments.ApplicationsshouldimplementToolforthesame.14/01/2716:52:26WARNmapred.JobClient:Nojobjarfileset.Userclassesmaynotbefound.SeeJobConf(Class)orJobConf#setJar(Stri

Hadoop java apache IntWritable debugging

hadoop - 通过分布式缓存hadoop添加jar

我正在使用分布式缓存将.jar文件添加到类路径:DistributedCache.addFileToClassPath(newPath("binary/tools.jar"),job.getConfiguration());我不确定addFileToClassPath()是否是用于将.jar文件添加到类路径的正确API。当我尝试从映射器检索类路径时，我看不到添加的jar。类路径包含作业的工作目录(jobcachedir)，但不包括通过分布式缓存分发的jar。Propertiesprop=System.getProperties();System.out.println("Theclas

hadoop jar code section

hadoop - 替换 hbase/lib/中的 hadoop*.jar 后，hbase 0.90.5 无法正常工作

我有Debian6.03和最好的friendhbase和hadoop的问题一步一步，我想要工作配置hbase(第一步是独立的)和hadoop:wgethttp://www.sai.msu.su/apache//hbase/hbase-0.90.5/hbase-0.90.5.tar.gztarxzfvhbase-0.90.5.tar.gzsudomvhbase-0.90.5/usr/local/sudoln-shbase-0.90.5/hbasesudochown-Rhduser:hadoophbase*lrwxrwxrwx1hduserhadoop13Янв2110:11hbase->

hadoop hbase master

hadoop - 在hadoop job jar的 "lib"文件夹下打包依赖库时，遇到ClassNotFoundException

我曾经将依赖库打包在Hadoopmap-reduce作业jar的“lib”文件夹中。那很好用。但这一次却出错了。有人可以给我一些解决问题的想法吗？问题如下:当我使用Eclipse“导出”功能和“将所需库提取到生成的JAR”选项打包作业jar时。生成的作业jar工作正常。但是如果我用ant-script打包作业jar以将依赖库包含在作业jar的“lib”文件夹中，我遇到了ClassNotFoundException:java.io.IOException:Splitclasscascading.tap.hadoop.MultiInputSplitnotfoundatorg.apache.

hadoop ClassNotFoundException java section

hadoop - Pig - 将 jar 添加到类路径

Pig将所有通过(pigserver.registerjar)注册的jar组合到一个job.jar中。这实际上删除了META-INF/MANIFEST.MF。我们有一个UDF，它使用包含预定义属性的MANIFEST.MF查找jar(我们的一个jar包含这个)。当Pig删除这个MANIFEST.MF时，我们的UDF停止工作。有没有办法将jar添加到类路径而不是registerjar？或者有什么办法可以克服这个问题吗？以下是代码片段:cluster=newCluster(newPigContext(ExecType.MAPREDUCE,properties));PigServerpigSe

hadoop Pig code section jar apache-pig

java - 为什么 Pig 的 job jar 这么大

当我通过PigServerjava类执行pig脚本时，会创建很多Jobxxx.jar。我知道这些是被发送到Hadoop集群的Map/Reduce作业。因为我有一个相当复杂的脚本，所以我知道这将分为许多不同的工作。然而，我很困惑，为什么这些jar文件必须这么大。当然，它们都包含我的UDF代码，它不是那么大，但它们还包含例如整个(展开的)org/apache/pig结构。生成的jar文件每个都超过7MB。在将这些文件发送到hadoop集群之前，如何防止这些文件变得太大？最佳答案由于多种原因，工作如此之大:正如mr2ert所说，可以为

java Pig code section jar hadoop apache-pig

199 200 201202203 204 205