草庐IT

Union-Find

全部标签

hadoop - pig 脚本 : Find sum of items in a group

这是我要运行的行counts=FOREACHz{sum=SUM(B::counter);GENERATEgroupasA::month,sum;};但是我收到以下错误:Invalidfieldprojection.Projectedfield[B::counter]doesnotexistinschema:group:chararray,y:bag{:tuple(A::id:chararray,A::month:chararray,B::counter:int)}.如何对这样一个包含基于一列分组的元组包的模式进行求和聚合? 最佳答案

hadoop - Spark on Yarn 作业失败,退出代码为 :1 and stderr says "Can' t find main class"

我们尝试将一个简单的SparkPI示例提交到SparkonYarn。bat写法如下:./bin/spark-submit--classorg.apache.spark.examples.SparkPi--masteryarn-cluster--num-executors3--driver-memory4g--executor-memory1g--executor-cores1.\examples\target\spark-examples_2.10-1.4.0.jar10pause我们的HDFS和Yarn运行良好。我们正在使用Hadoop2.7.0和Spark1.4.1。我们只有1个节

hadoop - Apache pig -错误 2229 : Couldn't find matching uid -1 for project

运行Pig脚本时出现以下异常。ERROR2229:Couldn'tfindmatchinguid-1forproject(Name:ProjectType:bytearrayUid:-1Input:0Column:12)org.apache.pig.impl.logicalLayer.FrontendException:ERROR2000:ErrorprocessingruleColumnMapKeyPrune.Try-tColumnMapKeyPruneatorg.apache.pig.newplan.optimizer.PlanOptimizer.optimize(PlanOpti

hadoop - 无法在 MESOS 框架 : Could not find or load main class org. apache.mesos.hdfs.scheduler.Main 上运行 HDFS

我尝试按照https://github.com/mesosphere/hdfs中提到的步骤进行操作.当我运行./bin/hdfs-mesos时,出现以下错误:Error:Couldnotfindorloadmainclassorg.apache.mesos.hdfs.scheduler.Main有谁知道我该如何解决这个错误? 最佳答案 为了运行mesos-hdfs,需要构建它。githubrepo仅包含源相同标记的版本。按照以下步骤操作:gitclonegit@github.com:mesosphere/hdfs.gitcdhdfs

java - Spark saveAsNewAPIHadoopFile java.io.IOException : Could not find a serializer for the Value class

我正在尝试将java对RDD存储为Hadoop序列文件,如下所示:JavaPairRDDputRdd=...config.set("io.serializations","org.apache.hadoop.io.serializer.JavaSerialization,org.apache.hadoop.io.serializer.WritableSerialization");putRdd.saveAsNewAPIHadoopFile(outputPath,ImmutableBytesWritable.class,Put.class,SequenceFileOutputFormat

java - 在 Hadoop 上运行 MapReduce 字数统计会给出异常消息 : The system cannot find the path specified

这是我的第一个StackOverflow问题。我已经在伪分布式模式下设置了我的hadoop(2.9.2)单节点集群。当我尝试运行hadoopjarC:/MapReduceClient.jarwordcount/input_dir/output_dir时,我得到以下错误日志19/01/1620:19:17INFOclient.RMProxy:ConnectingtoResourceManagerat/0.0.0.0:803219/01/1620:19:18INFOinput.FileInputFormat:Totalinputfilestoprocess:119/01/1620:19:1

java - pig 错误 : Could not find or load main class org. apache.pig.Main

我是PIG的初学者。我按照WIKI编写了一个程序,将文件中的单词转换为大写。--catUPPER.javapackagecom.bigdata.myUdf;importjava.io.IOException;importorg.apache.pig.EvalFunc;importorg.apache.pig.data.Tuple;importorg.apache.pig.impl.util.WrappedIOException;publicclassUPPERextendsEvalFunc{publicStringexec(Tupleinput)throwsIOException{if

java - Hadoop 上的错误 : Could not find or load main class org. apache.hadoop.hdfs.tools.GetConf

Error:Couldnotfindorloadmainclassorg.apache.hadoop.hdfs.tools.GetConf在[]上启动名称节点localhost:启动namenode,记录到/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-ingreens-namenode-ingreens-desktop.outlocalhost:启动datanode,记录到/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-ingreens-datanode-ingreens-desktop.out错误:无法找到

hadoop - 纱 : Could not find or load main class org. apache.hadoop.mapreduce.v2.app.MRAppMaster

尝试在Fedora上执行任何M/R2作业时出现此异常。Hadoop2.7.3和2.8.0有同样的问题。这包括Hive。[hadoop@masterhadoop]$yarnclasspath/opt/hadoop/hadoop-2.7.3/conf/opt/hadoop/hadoop-2.7.3/conf/opt/hadoop/hadoop-2.7.3/conf:/opt/hadoop/hadoop/share/hadoop/common/lib/*/opt/hadoop/hadoop/share/hadoop/common/*/opt/hadoop/hadoop/share/hadoo

import - HBase 导出/导入 : Unable to find output directory

我正在为我的应用程序使用HBase,我正在尝试使用org.apache.hadoop.hbase.mapreduce.Export导出数据,因为它是指示here.我面临的问题是,一旦执行了命令,创建导出时就没有错误。但是指定的输出目录并没有出现在它的位置。我使用的命令是$bin/hbaseorg.apache.hadoop.hbase.mapreduce.Exporttable_namedb_dump/ 最佳答案 我得到了解决方案,因此我正在回复我自己的答案hadoop的conf目录下的hadoop-env.sh必须有如下两行exp