草庐IT

system.configuration

全部标签

php - Hadoop 流 : no such file found error (error in configuring object)

我为hadoop流运行以下命令hadoopjarcontrib/streaming/hadoop-streaming-1.0.3.jar-inputtest1/testregxml.xml-outputtestoutput2-file~/Programs/CMapper.php-mapper~/Programs/CMapper.php-jobconfmapred.reduce.tasks=1hadoop任务失败,输出如下12/10/2615:36:56WARNstreaming.StreamJob:-jobconfoptionisdeprecated,pleaseuse-Dinstea

linux - Hadoop HDFS : DateNode directory on system partition?

我们用这种方式设置的Hadoop集群空间不足:1x1TBHDD/3个1.5TBHDD/data1/data2/data3系统分区几乎不用(97%空闲),不会用于与hadoop无关的任务。将系统分区作为HDFS数据目录添加到DataNode配置中是否安全?我担心Hadoop会填满分区并使系统无法使用。最好的方法可能是设置单独的lvm卷或重新分区磁盘。但我会避免走这条路。hadoop是否遵守unix配额?例如。如果我从系统分区添加一个目录并通过配额限制hadoop用户只能使用例如0.5TB会有帮助吗? 最佳答案 是的,Hadoop使用通

hadoop - 在reducer的configure方法中调用progress或者增加counter

有可能吗?上下文:我的reducer配置方法需要从DistributedCache读取一组文件(总大小约为150MB)。但是,我不知道为什么hadoop需要这么长时间才能杀死一些reducer,尽管事实上有一些reducer已成功完成。我使用旧的API,我只能在配置方法中访问JobConfconf变量。我的想法是让reporter变量成为一个字段,然后我可以在配置方法中调用它。但似乎在调用reduce之前调用了configure。 最佳答案 转换您的代码以使用新的API!然后在setup()中,您可以访问context变量并调用pr

configuration - 在 ec2 上手动配置 hadoop

谁能给我指出任何资源的方向,这些资源可以帮助我在EC2上手动设置/配置Hadoop(1.0.4)。我同意有很多资源可以使用工具、服务等来完成这项工作,但我正在寻找的是一些帮助,以确定对conf/*.xml文件进行哪些修改手动slaves和master都是为了让Hadoop正常工作。现在,我有5个ec2实例在运行,它们都能够在伪分布式模式下单独运行hadoop作业。所以,我需要通过配置conf文件的方式,将一个变成master,其余的变成slave,让slave知道namenode和jobtracker在哪里,而master知道所有的slave。我的理解是,我还必须配置实例的EC2安全组

java - 亚马逊电子病历 : Passing java system property to custom jar

AmazonEMR是否允许将系统属性传递给自定义jar,例如hadoopjar-Dkey=valuemyjob.jar?(上面的key,value在应用程序本身的初始化期间使用,而不是属于hadoop的Configuration对象。)相关话题Howtospecifymapredconfigurations&javaoptionswithcustomjarinCLIusingAmazon'sEMR?讨论了仅通过引导操作将系统属性传递给hadoop守护进程的方法,显然,这不允许对java入口点类执行相同的操作。 最佳答案 如果您不想将

apache - "The machine with the name ' c6401 ' was not found configured for this Vagrant environment."错误

我计划使用ApacheAmbari。首先,我根据https://cwiki.apache.org/confluence/display/AMBARI/Quick+Start+Guide完成了所有操作.但是每当我尝试启动vms时,我都会收到以下错误:Themachinewiththename'c6401'wasnotfoundconfiguredforthisVagrantenvironment. 最佳答案 今天在mac上遇到这个错误,我决定用适合我的解决方案更新这篇文章。步骤删除所有多余的机器文件夹./.vagrant/machin

java - 如何让 system.out.println() 在 hadoop 中工作

我正在尝试在hadoop中进行调试。我想使用System.out.println()将一些变量打印到终端,但没有任何内容输出到终端。我检查了下的作业历史记录/日志http://serverurl:19888/jobhistory/app但那里仍然只有INFO,没有println()。此外,我修改了log4j.properties,改了hadoop.root.logger=INFO,console到hadoop.root.logger=ALL,console但还是不行。有人有什么想法吗?非常感谢。 最佳答案 为什么不定义一个记录器并通

java - 在 Reducer 中使用 System.setProperty()

我正在尝试在我的Reducer中设置一个Java系统属性java.util.Arrays.useLegacyMergeSort,以强制系统使用JDK6实现的Arrays.sort方法,而不是JDK8。packagescoring.devicestatus;importjava.io.IOException;importjava.text.SimpleDateFormat;importjava.util.ArrayList;importjava.util.Collections;importjava.util.Date;importjava.util.LinkedHashMap;impo

hadoop - 普通身份验证失败 : User yarn is not configured for any impersonation. impersonationUser:alluxio mapreduce 中的 root

Causedby:org.apache.thrift.transport.TTransportException:Plainauthenticationfailed:Useryarnisnotconfiguredforanyimpersonation.模拟用户:root当我使用alluxio在本地运行wordcount程序时它工作正常。我也通过了集成测试,但是当我使用alluxio客户端jar运行相同的Hadoop程序时它给我一个错误bin/hadoopjar/usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jarwordcount

java - 在 Hadoop 上运行 MapReduce 字数统计会给出异常消息 : The system cannot find the path specified

这是我的第一个StackOverflow问题。我已经在伪分布式模式下设置了我的hadoop(2.9.2)单节点集群。当我尝试运行hadoopjarC:/MapReduceClient.jarwordcount/input_dir/output_dir时,我得到以下错误日志19/01/1620:19:17INFOclient.RMProxy:ConnectingtoResourceManagerat/0.0.0.0:803219/01/1620:19:18INFOinput.FileInputFormat:Totalinputfilestoprocess:119/01/1620:19:1