草庐IT

mapReduce

全部标签

java - 将多个 float 参数发送到 reducer 结果空指针异常

我是hadoop的新手。我正在尝试在以下代码中向reducer发送2个浮点参数。mapper成功地将参数传递给reducer但是如果我开始运行reducer空指针异常抛出..任何人都可以帮助我。提前致谢。publicclassMaxTemperatureextendsConfiguredimplementsTool{publicstaticclassMapMapperextendsMapper{publicvoidmap(LongWritablekey,Textvalue,Contextcontext)throwsIOException,InterruptedException{Str

java - 如何在 hadoop 中将 reducer 输出作为 xml 格式

我创建了一个自定义的xmloutputformat类,将reducer的输出转换为xml格式。这里的问题是代码执行成功但最终输出是普通格式而不是XML格式。谁能帮帮我……?packagedd;importjava.io.IOException;importjava.net.URI;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.conf.Configured;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;im

hadoop - 最简单的 Hive 查询不起作用

当我尝试获取查询时SELECT*FROMA我得到了所有信息,但是当尝试获取存在列名(或连接)的查询时SELECTaFROMA它返回一些异常:TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksissetto0sincethere'snoreduceoperatororg.apache.hadoop.ipc.RemoteException:java.io.IOException:File/tmp/hive-merza/hive_2014-06-25_09-12-19_567_6884805431385202274/-mr-1

hadoop - pig 错误 1066 : Unable to open iterator for alias test

我得到:org.apache.pig.impl.logicalLayer.FrontendException:ERROR1066:Unabletoopeniteratorfortest当我有代码时:my_file=LOAD'$my_records_file'USINGPigStorage('\t')AS(field0:chararray,field1:int);test=FILTERmy_fileBYfield0!=null;为什么会出现此错误? 最佳答案 我想您想过滤具有空值的行?语法是field0ISNOTNULL。my_fil

java - Hadoop 映射器输出到 HBase 表和一个缩减器

我正在尝试编写一个MapReduce作业来解析CSV文件,将数据存储在HBase中,并一次性执行reduce函数。理想情况下我想要Mapper输出好的记录到HBaseTableGOODMapper输出坏记录到HBase表BADMapper使用key将所有好的数据发送到reducer还想更新第三个表以指示存在新数据。该表将包含有关数据和日期的基本信息。每个CSV文件很可能只有一两条记录。我知道如何使用HBaseMultiTableOutputFormat执行1和2,但不确定如何执行3和4。非常感谢任何有关如何执行此操作的指示。我对如何做到这一点有一些想法:对于1和2,我将Immutabl

java - 如何从设置方法中停止 map task ?

我在作业类中有一些映射类,有时我需要中断当前任务的执行(HadoopMap-Reduce框架为作业的InputFormat生成的每个InputSplit生成一个映射任务):publicstaticclassTestJobMapperextendsMapper{@Overrideprotectedvoidsetup(Contextcontext)throwsIOException,InterruptedException{super.setup(context);//hereIwanttochecksomepredicate,andmaybebreakexecutionoftask//h

java - 控制不会进入 hadoop 中的 reducer

我在hadoop中写了一个自定义的输入格式和数据类型,它可以读取图像,将它存储到RGB数组中。但是当我在我的map和reduce函数中实现时,控制不会转到reducer函数。importjava.io.IOException;importjava.util.*;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.conf.*;importorg.apache.hadoop.io.*;importorg.apache.hadoop.mapreduce.*;importorg.apache.hadoop.mapreduce.lib

hadoop - 为什么 reducer 的数量大于我在 Hadoop 中指定的数量?

这是我的MR作业在控制台上的输出。作业成功完成。但我有两个顾虑。1)我指定了-Dmapred.reduce.slowstart.completed.maps=0.75。但是本地图完成75%时reducer没有启动,如下所示2)我指定了-Dmapred.reduce.tasks=2。但是启动的reducer任务的数量是3(如下所示)。为什么这两个参数没有被处理?hadoopjarhadoop-examples-1.2.1.jarwordcount-Dmapred.reduce.slowstart.completed.maps=0.75-Dmapred.reduce.tasks=2/dat

hadoop - Avro mapreduce 作业失败 java.lang.IncompatibleClassChangeError

我正在使用HDP2.0-hadoop2.2.0和ApacheAvro1.7.4并遵循新M/Rapi的avromapreduce指南here出现以下错误2014-07-1505:46:04,354FATAL[main]org.apache.hadoop.mapred.YarnChild:Errorrunningchild:java.lang.IncompatibleClassChangeError:Foundinterfaceorg.apache.hadoop.mapreduce.TaskAttemptContext,butclasswasexpectedatorg.apache.avr

java - 在 Hadoop 中选择不同的记录并使用组合器

“MapReduceDesignPatterns”一书包含用于在数据集中查找不同记录的模式。这是算法:map(key,record):emitrecord,nullreduce(key,records):emitkey第66页说:TheCombinercanalwaysbeutilizedinthispatternandcanhelpiftherearealargenumberofduplicates.map阶段发出记录和NullWritable(不在线路上写入)。Combiner试图减少什么?没有减少的记录。 最佳答案 它试图减少