Hadoop2

java - Hadoop Custom Partitioner 的行为不符合逻辑

基于这个例子here，这有效。在我的数据集上尝试过相同的方法。示例数据集:OBSERVATION;2474472;137176;OBSERVATION;2474473;137176;OBSERVATION;2474474;137176;OBSERVATION;2474475;137177;将每一行视为字符串，我的Mapper输出为:key->string[2],value->string.我的分区程序代码:@OverridepublicintgetPartition(Textkey,Textvalue,intreducersDefined){StringkeyStr=key.toStr

hadoop - oozie workflow 被杀死时回滚 Action

我一直在尝试在oozie中的一个Action失败时触发一个Action我可以使用错误节点来做到这一点，如下所示如果我的要求是在当前操作在oozie中失败时回滚，这将非常有效。我一直在寻找的是在工作流被终止的情况下触发一个步骤(如果有人进入工作流并单击HUE中的终止按钮。)当我通过HUE使用oozie时，我可以看到在workflow.xml中生成了一个名为kill的节点。我试图将我的自定义操作放在这个空间中，但每次我保存xml时，工作流都会获得默认值，如下所示Actionfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]

杀死 workflow section lt gt hadoop oozie hue

hadoop - 在没有格式的情况下重启Hadoop集群中的NameNode

由于某些原因不得不关闭我在集群中的主节点，就好像我们再次启动集群一样，名称节点不会运行，除非我们再次格式化它，他们是否有任何解决方案来启动名称节点而不格式化...尝试了一切..Start-all.sh或单独启动namenode/datanodes但Namenode不会启动，直到我再次格式化它，如何在不格式化的情况下启动Name-node。提前致谢最佳答案请发布日志信息。其实重启hadoop时不需要格式化。因为HDFS的元信息会存储在磁盘中，如果格式化namenode，元信息就会丢失。你可以试试停止集群时namenode进程是否还

NameNode hadoop section stackoverflow

hadoop - 限制 Application Master 请求的资源的属性

HadoopMRv2(Yarn)中是否有一个属性允许我们专门操纵ApplicationMaster请求的资源量(VCores和堆内存)？或者ApplicationMaster会动态评估所需的资源(基于每个应用程序)并为容器请求相应的资源？最佳答案以下属性可用于为YARNApplicationmaster设置VCors和HeapMemory。yarn.app.mapreduce.am.resource.mb8192yarn.app.mapreduce.am.resource.cpu-vcores1yarn.app.mapreduc

Application hadoop section gt lt hadoop-yarn

java - IntelliJ 不显示 hadoop 错误

我将所有环境设置为在IntelliJ中运行hadoop应用程序。现在，我遇到了一些问题，因为我的代码编译时没有错误消息，尽管我没有hadoop输出。所以，我不得不构建工件，在我的本地hadoop上运行它，然后得到这个错误Foundinterfaceorg.apache.hadoop.mapreduce.TaskAttemptContext,butclasswasexpectedatorg.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)然后我就可以调试它了。我的问题是为什么这个错误没有显示

IntelliJ hadoop libexec common java debugging intellij-idea

hadoop - 如何提高水槽的性能

我正在通过flumesink将事件从flume发送到kafka主题....为此，我正在使用文件channel，但是在写入kafka时我的性能非常低，flumesink以每秒190msg的速度写入而水槽源正在以每秒3000条消息的速率将事件转储到channel....我想提高我的接收器性能......请帮助我如何实现......我已经尝试了各种配置....这是我的配置文件-----agent1.sources=AspectJagent1.channels=fileTailChannelagent1.sinks=APMNullSink#AspectJsourceagent1.sources

水槽 hadoop agent1 agent APMNullSink flume

hadoop - 在 Hadoop 中设置复制

我尝试使用hadoopAPI加载文件作为实验。我想将复制设置为最低，因为这是为了实验。我首先尝试使用FileSystem.setReplication():Configurationconfig=newConfiguration();config.set("fs.defaultFS","hdfs://192.168.248.166:8020");FileSystemdfs2=FileSystem.get(config);Pathsrc2=newPath("C:\\Users\\abc\\Desktop\\testfile.txt");Pathdst2=newPath(dfs2.getW

中设 hadoop code section config hdfs

hadoop - 无法在 hadoop 2.6 中格式化 Namenode？

我已经在ubuntu14.04上安装了hadoop2.6。我刚刚关注了thisblog.当我尝试格式化名称节点时，我遇到了以下错误:hduser@data1:~$hadoopnamenode-formatDEPRECATED:Useofthisscripttoexecutehdfscommandisdeprecated.Insteadusethehdfscommandforit./usr/local/hadoop/bin/hdfs:line276:/home/hduser/usr/lib/jvm/java-7-openjdk-amd64/bin/java:Nosuchfileordir

hadoop Namenode section blockquote bigdata

hadoop - Oozie 作业在运行 hue 时由于 "not org.apache.hadoop.mapred.Mapper"而失败

我正在尝试通过oozie作业运行wordcount程序。当我像hadoopjarwordcoutjar/data.txt/out一样手动运行wordcoutjar时。它运行良好并给我输出。这是我的wordcount程序的映射器代码的详细信息。publicclassMapperWordcountextendsMapper{privatefinalstaticIntWritableone=newIntWritable(1);privateTextword=newText();publicvoidmap(LongWritablekey,Textvalue,Contextcontext)thr

hadoop amp apache java mapreduce oozie hue oozie-coordinator

hadoop - 无法让日志聚合在 Amazon-Hadoop 集群上工作

我尽我所能使日志聚合，但我做不到。所以我需要你的帮助来解决这个问题:我将其添加到yarn-site.xml并重新启动但没有任何乐趣。yarn.log-aggregation-enabletrueWheretoaggregatelogsto.yarn.nodemanager.remote-app-log-dir/tmp/logsyarn.log-aggregation.retain-seconds259200yarn.log-aggregation.retain-check-interval-seconds3600当我尝试通过以下方式进行聚合时:yarnlogs-applicationI

上工 Amazon-Hadoop lt gt property hadoop amazon-ec2 hadoop-yarn

151 152 153154155 156 157