草庐IT

main_test

全部标签

python - 从发送到 spark-submit 的外部 __main__ 文件修改 SparkContext

我正在尝试打包python依赖项,以便使用spark-submit发送到hadoop集群,我希望尽可能以DRYest方式执行此操作。我希望我的my_spark_app.py看起来像这样:frompysparkimportSparkContext,SparkConfconf=SparkConf().setAppName('MyApp').setMaster('yarn-client')sc=SparkContext(conf=conf)sc.addPyFile('/path/to/dependencies.py')fromdependenciesimportDependencyManag

Hadoop异常-清理暂存区/staging/test/.staging/job_201211221353_0010

我的作业配置如下,我正在尝试对我的hadoop作业进行简单的两步链接,publicintrun(String[]args)throwsException{Configurationconf=getConf();if(args.length!=2){System.err.println("Usage:moviecount3");System.exit(2);}ConfigurationUtil.dumpConfigurations(conf,System.out);LOG.info("input:"+args[0]+"output:"+args[1]);Jobjob=newJob(con

hadoop - pig 错误 1066 : Unable to open iterator for alias test

我得到:org.apache.pig.impl.logicalLayer.FrontendException:ERROR1066:Unabletoopeniteratorfortest当我有代码时:my_file=LOAD'$my_records_file'USINGPigStorage('\t')AS(field0:chararray,field1:int);test=FILTERmy_fileBYfield0!=null;为什么会出现此错误? 最佳答案 我想您想过滤具有空值的行?语法是field0ISNOTNULL。my_fil

Hadoop:格式化名称节点时出错 - 'Could not find or load main class namenodes'

在我安装了上传hadoop所需的一切之后(win-7-64位上的unix),我得到了这个错误(粗体):roeygol@roeygol-PC/etc/hadoop-2.5.1/bin$./hdfsnamenodes-formatError:Couldnotfindorloadmainclassnamenodes我按要求定义了所需的节点和所有其他配置,我该如何解决这个问题? 最佳答案 hdfsnamenode-formatits"namenode"not"namenodes" 关于Hadoo

java - mapreduce 程序中的错误 : Exception in thread "main" java. lang.VerifyError

我是mapreduce程序的初学者,在运行该程序时出现以下错误:Exceptioninthread"main"java.lang.VerifyError:(class:com/google/common/collect/Interners,method:newWeakInternersignature:()Lcom/google/common/collect/Interner;)Incompatibleargumenttofunction错误是什么以及要包含哪个jar文件? 最佳答案 另一个原因是同时使用google-collect

java - 线程 "main"java.lang.VerifyError : Bad type on operand stack 中的异常

此错误已发生在map-reduce程序中,用于在给定的input.txt文件中查找最高温度。我写了两列,分别是年份和温度。Exceptioninthread"main"java.lang.VerifyError:BadtypeonoperandstackExceptionDetails:Location:org/apache/hadoop/mapred/JobTrackerInstrumentation.create(Lorg/apache/hadoop/mapred/JobTracker;Lorg/apache/hadoop/mapred/JobConf;)Lorg/apache/h

hadoop - 线程 "main"java.lang.NoClassDefFoundError : org/apache/hadoop/yarn/exceptions/YarnRuntimeException 中的异常

我在hadoop-2.7.0上运行了一个mapreduce作业,但是这个mapreduce作业没有完成,我遇到了这个错误:Jobjob_1491881070758_0003failedwithstateFAILEDdueto:Applicationapplication_1491881070758_0003failed2timesduetoAMContainerforappattempt_1491881070758_0003_000002exitedwithexitCode:1Formoredetailedoutput,checkapplicationtrackingpage:http

hadoop - 线程 "main"org.apache.hadoop.mapred.InvalidJobConfException : Output directory not set 中的异常

嘿,你能帮我清除以下错误吗?当我运行Mapreduce作业fopr将数据从hdfs文件插入到hbase表中时,我得到了这个。使用HFileOutputFormat.class,之前我使用MultiTableOutputFormat.class运行相同的程序,它工作正常,但是在将数据插入hbase表时花费了很多时间。那么你能帮帮我吗……:)*job.setMapOutputKeyClass(ImmutableBytesWritable.class);job.setMapOutputValueClass(Put.class);job.setInputFormatClass(TextInpu

Mesos 上的 Hadoop 失败并显示 "Could not find or load main class org.apache.hadoop.mapred.MesosExecutor"

我有一个Mesos集群设置——我已经验证主节点可以看到从节点——但是当我尝试运行Hadoop作业时,所有任务都以LOST状态结束。所有从站stderr日志中都存在相同的错误:Error:Couldnotfindorloadmainclassorg.apache.hadoop.mapred.MesosExecutor这是stderr日志中唯一的一行。按照http://mesosphere.io/learn/run-hadoop-on-mesos/上的说明进行操作,我在HDFS上放置了一个修改后的Hadoop分布,每个从站都可以访问它。在Hadoop发行版的lib目录中,我添加了hadoo

hadoop - 线程 "main"java.lang.NoClassDefFoundError : org/apache/hadoop/util/Tool 中的异常

Igetbelowerrorwhenipackage(jar)andrunmydefaulthadoopjob.Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/hadoop/util/Toolatjava.lang.ClassLoader.defineClass1(NativeMethod)atjava.lang.ClassLoader.defineClassCond(ClassLoader.java:631)atjava.lang.ClassLoader.defineClass(ClassLoader.