configurer

configuration - 在单节点集群上确定 Hadoop Conf 设置的一般方法

我想知道如何最好地确定适当数量的map和reduce任务以及JVM堆的相应最大大小？对于那些刚接触Hadoop的人来说，这些是在mapred-site.xml文件。有没有我可以根据(虚拟)内核和RAM的数量遵循的通用公式？在您的回复中，请考虑在作业之前/期间创建的各种其他Hadoop进程处理及其对RAM使用的影响(参见:https://forums.aws.amazon.com/thread.jspa?threadID=49024)从单机集群到双机集群，如何应对变化？最佳答案时间已经过去，没有人试图制定一个答案。所以我会提出一些

configuration Hadoop section 的 configuration-files task configuration-management

org.apache.hadoop.conf.Configuration.getLocalpath(配置)中的 java.lang.NullPointerException

有没有人遇到过这个问题？ThefollowingaretheerrorinformationwhenIrunthejob:13/01/1015:53:19INFOmapred.JobClient:TaskId:attempt_201301101540_0001_m_000010_0,Status:FAILEDjava.lang.NullPointerExceptionatorg.apache.hadoop.conf.Configuration.getLocalPath(Configuration.java:934)atnfs.iscas.sil.hcir.index.ImageInde

NullPointerException Configuration section java apache hadoop mapreduce

hadoop - 查询返回非零代码 : 1, 导致 : hive configuration hive. root.logger 不存在

我正在尝试运行HiveCLI(bin/hive)，但以下错误不允许Hive启动:Queryreturnednon-zerocode:1,cause:hiveconfigurationhive.root.loggerdoesnotexists.这是整个调试信息:JavaHotSpot(TM)64-BitServerVMwarning:UsingtheParNewyoungcollectorwiththeSerialoldcollectorisdeprecatedandwilllikelyberemovedinafuturereleaseSLF4J:Classpathcontainsmul

hive configuration 04 main hadoop

xml - 配置单元-site.xml : The element type "configuration" must be terminated by the matching end-tag "</configuration>"

为了练习/学习，我正在尝试在Ubuntu系统上安装Hive。我正在遵循一组预先编写的说明。它说通过转到$HIVE_HOME并运行bin/hive来测试Hive安装。当我这样做时，我得到了相当大的文本转储，但我认为最重要的一点如下:**[FatalError]hive-site.xml:2787:3:Theelementtype"configuration"mustbeterminatedbythematchingend-tag"".17/05/0610:46:12FATALconf.Configuration:errorparsingconffile:/usr/local/hive/c

amp configuration gt lt code xml hadoop hive

Hadoop 3 : how to configure/enable erasure coding?

我正在尝试设置Hadoop3集群。关于纠删码功能的两个问题:如何确保启用纠删码？我还需要将复制因子设置为3吗？请指出与纠删码/复制相关的相关配置属性，以获得与Hadoop2(复制因子3)相同的数据安全性，但具有Hadoop3纠删码的磁盘空间优势(仅50%的开销，而不是200%). 最佳答案在Hadoop3中，我们可以对HDFS中的任何文件夹启用纠删码策略。默认情况下，Hadoop3中没有启用删除编码，您可以使用setPolicy命令并指定所需的文件夹路径来启用它。1:要确保纠删码已启用，您可以运行getPolicy命令。2:在Ha

configure erasure code section Hadoop hdfs bigdata hadoop3 erasure-code

configuration - 能够限制 hadoop hive mapred 作业的最大 reducer ？

我试过在查询前加上:setmapred.running.reduce.limit=25;和sethive.exec.reducers.max=35;最后一个将530个reducer的工作减少到35...这让我觉得它会尝试将530个reducer的工作值(value)降低到35个。现在给setmapred.tasktracker.reduce.tasks.maximum=3;尝试查看该数字是否是每个节点的某种最大值(之前在具有70个潜在reducer的集群上为7)。更新:setmapred.tasktracker.reduce.tasks.maximum=3;没有效果，但值得一试。

configuration 能够 section reducer code hadoop hive

linux - Hadoop HDFS 测试运行问题 - org.apache.hadoop.conf.Configuration NoClassDefFoundError

我正在使用Hadoop0.21.0。并尝试运行CAPI库附带的hdfs_test应用程序。经过许多问题后，我能够编译hdfs_test。现在，当我运行它时:./hdfs_test我收到以下错误:Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/commons/logging/LogFactoryatorg.apache.hadoop.conf.Configuration.(Configuration.java:153)Causedby:java.lang.ClassNotFoundException:org

NoClassDefFoundError Configuration java section URLClassLoader linux gcc hadoop hdfs

php - Hadoop 流 : no such file found error (error in configuring object)

我为hadoop流运行以下命令hadoopjarcontrib/streaming/hadoop-streaming-1.0.3.jar-inputtest1/testregxml.xml-outputtestoutput2-file~/Programs/CMapper.php-mapper~/Programs/CMapper.php-jobconfmapred.reduce.tasks=1hadoop任务失败，输出如下12/10/2615:36:56WARNstreaming.StreamJob:-jobconfoptionisdeprecated,pleaseuse-Dinstea

error configuring hadoop java 201209282004 php hadoop-streaming

hadoop - 在reducer的configure方法中调用progress或者增加counter

有可能吗？上下文:我的reducer配置方法需要从DistributedCache读取一组文件(总大小约为150MB)。但是，我不知道为什么hadoop需要这么长时间才能杀死一些reducer，尽管事实上有一些reducer已成功完成。我使用旧的API，我只能在配置方法中访问JobConfconf变量。我的想法是让reporter变量成为一个字段，然后我可以在配置方法中调用它。但似乎在调用reduce之前调用了configure。最佳答案转换您的代码以使用新的API!然后在setup()中，您可以访问context变量并调用pr

configure progress section code reducer hadoop

configuration - 在 ec2 上手动配置 hadoop

谁能给我指出任何资源的方向，这些资源可以帮助我在EC2上手动设置/配置Hadoop(1.0.4)。我同意有很多资源可以使用工具、服务等来完成这项工作，但我正在寻找的是一些帮助，以确定对conf/*.xml文件进行哪些修改手动slaves和master都是为了让Hadoop正常工作。现在，我有5个ec2实例在运行，它们都能够在伪分布式模式下单独运行hadoop作业。所以，我需要通过配置conf文件的方式，将一个变成master，其余的变成slave，让slave知道namenode和jobtracker在哪里，而master知道所有的slave。我的理解是，我还必须配置实例的EC2安全组

configuration hadoop section strong amazon-ec2

53 54 555657 58 59