hadoop-release

hadoop - 限制 Application Master 请求的资源的属性

HadoopMRv2(Yarn)中是否有一个属性允许我们专门操纵ApplicationMaster请求的资源量(VCores和堆内存)？或者ApplicationMaster会动态评估所需的资源(基于每个应用程序)并为容器请求相应的资源？最佳答案以下属性可用于为YARNApplicationmaster设置VCors和HeapMemory。yarn.app.mapreduce.am.resource.mb8192yarn.app.mapreduce.am.resource.cpu-vcores1yarn.app.mapreduc

java - IntelliJ 不显示 hadoop 错误

我将所有环境设置为在IntelliJ中运行hadoop应用程序。现在，我遇到了一些问题，因为我的代码编译时没有错误消息，尽管我没有hadoop输出。所以，我不得不构建工件，在我的本地hadoop上运行它，然后得到这个错误Foundinterfaceorg.apache.hadoop.mapreduce.TaskAttemptContext,butclasswasexpectedatorg.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)然后我就可以调试它了。我的问题是为什么这个错误没有显示

IntelliJ hadoop libexec common java debugging intellij-idea

hadoop - 如何提高水槽的性能

我正在通过flumesink将事件从flume发送到kafka主题....为此，我正在使用文件channel，但是在写入kafka时我的性能非常低，flumesink以每秒190msg的速度写入而水槽源正在以每秒3000条消息的速率将事件转储到channel....我想提高我的接收器性能......请帮助我如何实现......我已经尝试了各种配置....这是我的配置文件-----agent1.sources=AspectJagent1.channels=fileTailChannelagent1.sinks=APMNullSink#AspectJsourceagent1.sources

水槽 hadoop agent1 agent APMNullSink flume

hadoop - 在 Hadoop 中设置复制

我尝试使用hadoopAPI加载文件作为实验。我想将复制设置为最低，因为这是为了实验。我首先尝试使用FileSystem.setReplication():Configurationconfig=newConfiguration();config.set("fs.defaultFS","hdfs://192.168.248.166:8020");FileSystemdfs2=FileSystem.get(config);Pathsrc2=newPath("C:\\Users\\abc\\Desktop\\testfile.txt");Pathdst2=newPath(dfs2.getW

中设 hadoop code section config hdfs

hadoop - 无法在 hadoop 2.6 中格式化 Namenode？

我已经在ubuntu14.04上安装了hadoop2.6。我刚刚关注了thisblog.当我尝试格式化名称节点时，我遇到了以下错误:hduser@data1:~$hadoopnamenode-formatDEPRECATED:Useofthisscripttoexecutehdfscommandisdeprecated.Insteadusethehdfscommandforit./usr/local/hadoop/bin/hdfs:line276:/home/hduser/usr/lib/jvm/java-7-openjdk-amd64/bin/java:Nosuchfileordir

hadoop Namenode section blockquote bigdata

hadoop - Oozie 作业在运行 hue 时由于 "not org.apache.hadoop.mapred.Mapper"而失败

我正在尝试通过oozie作业运行wordcount程序。当我像hadoopjarwordcoutjar/data.txt/out一样手动运行wordcoutjar时。它运行良好并给我输出。这是我的wordcount程序的映射器代码的详细信息。publicclassMapperWordcountextendsMapper{privatefinalstaticIntWritableone=newIntWritable(1);privateTextword=newText();publicvoidmap(LongWritablekey,Textvalue,Contextcontext)thr

hadoop amp apache java mapreduce oozie hue oozie-coordinator

hadoop - 无法让日志聚合在 Amazon-Hadoop 集群上工作

我尽我所能使日志聚合，但我做不到。所以我需要你的帮助来解决这个问题:我将其添加到yarn-site.xml并重新启动但没有任何乐趣。yarn.log-aggregation-enabletrueWheretoaggregatelogsto.yarn.nodemanager.remote-app-log-dir/tmp/logsyarn.log-aggregation.retain-seconds259200yarn.log-aggregation.retain-check-interval-seconds3600当我尝试通过以下方式进行聚合时:yarnlogs-applicationI

上工 Amazon-Hadoop lt gt property hadoop amazon-ec2 hadoop-yarn

hadoop - 从 MapReduce 同时批量加载到多个 HBase 表

类似于MultiTableOutputFormat，您可以使用put写入多个HBase表。是否有一种内置方法可以生成多个HFile而无需多次循环输入？最佳答案 This是最接近您的要求。他们也给出了代码来处理多种输出格式。再来一个here.希望对您有所帮助关于hadoop-从MapReduce同时批量加载到多个HBase表，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/317

MapReduce hadoop section code noreferrer hbase

hadoop - Hive:GROUP By 上的子查询

需要Hive查询的帮助。我写了一个Hive查询:selectto_date(from_unixtime(epoch))asdate,count1,count2,count3fromtable1wherecount3=168这给我的结果如下:datecount1count2count37-15-2015168377-15-2015168157-15-201516843andsimilarlyforotherdates....最后，我需要编写一个查询，返回每个日期的count2和count3的中值。例如:我需要输出为:datecount1count2count37-15-201516835

hadoop GROUP count section code hive hiveql

hadoop - 从 oozie 以本地模式运行 PIG

我想在本地模式下运行PIG，这很容易pig-xlocalfile.pig我的要求是从OOZIE以本地模式运行PIG？有没有可能像我想的那样OOZIE会先自动启动maptask？最佳答案这是可能的。当Oozie运行pig脚本时，它作为单映射map-reduce作业运行，它只运行pig脚本，而pig脚本又运行其他map-reduce作业(当pig在mapred中运行时>模式)。看来，Pig操作配置不允许在本地模式下运行，但您仍然可以使用shell操作类型在本地模式下运行Pig脚本。您只需确保您的脚本、输入和输出数据位于HDFS中。

hadoop oozie strong section pig apache-pig

162 163 164165166 167 168