mapreduce-name

hadoop - 连接异常 : Connection refused when run mapreduce in Hadoop

我在多机模式下设置了Hadoop(2.6.0):1个名称节点+3个数据节点。当我使用命令:start-all.sh时，它们(名称节点、数据节点、资源管理器、节点管理器)工作正常。我用jps命令检查了它，每个节点上的结果如下:名称节点:7300ResourceManager6942NameNode7154SecondaryNameNode数据节点:3840DataNode3924NodeManager我还在HDFS上上传了示例文本文件:/user/hadoop/data/sample.txt。那一刻绝对没有错误。但是当我尝试使用hadoop示例的jar运行mapreduce时:hadoo

Connection mapreduce hadoop gt lt resourcemanager connection-refused

hadoop - sqoop hadoop-mapreduce 不存在

我在sqoop上运行导入命令，但遇到以下问题。有人可以帮我解决这个问题吗。错误:/usr/local/sqoop-1.4.5.bin__hadoop-2.0.4-alpha/bin/../../hadoop-mapreduce不存在!请将$HADOOP_MAPRED_HOME设置为您的HadoopMapReduce安装的根目录。我的bashrc:exportJAVA_HOME=$(/usr/libexec/java_home)exportHADOOP_HOME=/usr/local/Cellar/hadoop/2.6.0/libexecexportHADOOP_YARN_HOME=$H

hadoop hadoop-mapreduce HOME code sqoop

hadoop - MapReduce 工作卡住了

我是hadoop的新手。我在ubuntu12.04上使用cloudera管理器安装了clouderahadoop。当我尝试使用cloudera的“测试安装”文档下给出的命令测试我的安装时，我的mapreduce作业卡在了接受阶段，并且永远不会从那里继续。我必须杀死工作。这是我正在使用的命令:sudo-uhdfshadoopjar/usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jarpi101在hue作业浏览器中，作业状态已被接受。我们将不胜感激任何形式的帮助。提前致谢。最佳答案

卡住 MapReduce section hadoop cloudera hue

java - 有了对象列表，如何使用 mapReduce 将单个对象传递给每个映射器类？

关于WordCount示例的两个问题:http://wiki.apache.org/hadoop/WordCount如果我在示例中理解正确:主类接收一个输入文件(第57行)每个映射器都会收到该文件的一行(第22行)？我正在尝试做一些不同的事情:而不是将输入文件传递给主类，假设我的主类有一些对象的列表例如:ListTransitiontransactionsList;并且我希望每个映射器接收此列表中的单个项目:在我的示例中:TransitionsingleTrans；我怎样才能做这样的事情？最佳答案关于您的第一个问题:是的，第57

象传射器 section noreferrer java hadoop mapreduce

java - 尝试在 shell 脚本中同时运行 hadoop MapReduce 命令和 linux 命令

我有一个这样的shell脚本。#!/bin/sh/home/hduser/Downloads/hadoop/bin/stop-all.shecho"RUNNINGHADOOPPROGRAM"cd/home/hduser/Downloads/hadoopsudorm-R/tmp/*sudorm-R/app/*cdsudomkdir-p/app/hadoop/tmpsudochownhduser:hadoop/app/hadoop/tmpsudochmod750/app/hadoop/tmphadoopnamenode-format/home/hduser/Downloads/hadoop

MapReduce hadoop hduser Downloads java shell

java - 自定义 SortComparator 在 MapReduce wordcount 程序中不起作用

我想了解MapReduce如何对Map输出键进行排序，以及它使用的排序算法是什么。我有一个这样的文本文件abefcb它如何使用这些键执行排序。我实现了一个扩展WritableComparator接口(interface)的自定义SortComparator类。我想看看排序是如何进行的，所以我将操作写入文件。publicstaticclassMySortComparator2extendsWritableComparator{@Overridepublicintcompare(byte[]b1,ints1,intl1,byte[]b2,ints2,intl2){Textx=newText

自定 SortComparator Comparing returning with java sorting hadoop mapreduce

java - 如何在mapreduce中将文件作为参数传递

我想在文件中搜索特定的单词并显示它的计数。当要搜索的单词是单个单词时，我可以通过在驱动程序中设置配置来完成，如下所示:驱动类:Configurationconf=newConfiguration();conf.set("wordtosearch","fun");映射器类:publicstaticclassSearchMapperextendsMapper{//Mapcodegoeshere.privatefinalstaticIntWritableone=newIntWritable(1);privateTextword=newText();publicvoidmap(LongWrit

何在 mapreduce code section context java caching hadoop

java - MapReduce Avro 输出正在创建文本文件

我有一个读取avro数据然后应该输出avro数据的MapReduce作业。但是，当我在作业成功时检查输出文件时，它们没有.avro扩展名，我可以使用简单的文本编辑器查看它们。我的驱动程序配置为输出avro，所以我不确定问题出在哪里，我们将不胜感激。这是我的驱动类:publicclassDriverextendsConfiguredimplementsTool{publicstaticvoidmain(String[]args)throwsException{intres=ToolRunner.run(newConfiguration(),newDriver(),args);System

MapReduce 本文 LongWritable job outputList java hadoop avro

java - mapreduce 中永无止境的工作

我已经在我的main方法中设置了一些MapReduce配置configuration.set("mapreduce.jobtracker.address","localhost:54311");configuration.set("mapreduce.framework.name","yarn");configuration.set("yarn.resourcemanager.address","localhost:8032");现在，当我启动mapreduce任务时，会跟踪该进程(我可以在我的集群仪表板(监听端口8088的仪表板)中看到它)，但该进程从未完成。它在以下行仍然被阻止:1

mapreduce java code section hadoop configuration

java - Mapreduce 程序无法读取输入文件

我在hdfs上的这个位置有一个小的csv文件:"hdfs://csehadoop/user/department.csv"。我在我的mapreduce程序中使用以下代码来读取文件的内容并将其存储在hashmap中。brReader=newBufferedReader(newFileReader("hdfs://csehadoop/user/department.csv"));while((strLineRead=brReader.readLine())!=null){StringdeptFieldArray[]=strLineRead.split(",");System.out.pri

Mapreduce java code section deptFieldArray hadoop hdfs