正在学习hadoop,尝试按照网上的资料搭建环境。我已经配置了ssh(sshlocalhost不需要密码),配置了“core-site.xml”、“hdfs-site.xml”、“mapred-site.xml”和“yarn-site.xml”但是当我尝试“hadoopnamenode-format”时,它给出了“java.net.UnknownHostException”和host=java.net.UnknownHostException:我尝试搜索联机帮助,但几乎都是:更改etc/hosts中的网络配置。但是我使用的是hadoop2.4,没有这样的文件夹。有什么建议吗?谢谢!
我正在测试hadoop,截至目前我有:1)localhost:8088工作2)localhost:50070工作3)我在hdfs上创建了一些文件然后我启动pig,对文件执行LOAD,然后执行FILTER,最后执行DUMP。当我DUMP时,pig显示有关mapreduce开始的信息。它以这样的句子结尾:“MapReduceLauncher-0%完成”+“正在运行的作业是[job_xxx]”。所以我认为工作启动了。我什至在localhost:8088的hadoop界面上将它视为一个已接受的应用程序。但随后什么也没有发生:它停留在0%完成:-(因此,作业是“已接受”但永远不会运行:-(我应该
ls:CallFromjava.net.UnknownHostException:ubuntu:ubuntu:unknownerrortolocalhost:9000failedonconnectionexception:java.net.ConnectException:Connectionrefused;Formoredetailssee:http://wiki.apache.org/hadoop/ConnectionRefused我的hadoop配置是这样的。/etc/主机127.0.0.1localhost#ThefollowinglinesaredesirableforIPv
我在macOSSierra(Darwin内核版本16.7.0)上安装了Hadoop2.8.1,它工作正常,除了应用程序/任务跟踪。1)一开始,我以为是资源管理器网页界面的问题。所以:我已将yarn-site.xml模板复制到etc/yarn-site.xml文件,但没有帮助。我已经尝试更改默认的'dr.谁是资源管理器上我的Hadoop用户的用户(http://localhost:18088/cluster/apps/RUNNING?user.name=myUser),但这也没有帮助。2)即使在命令行上我也无法跟踪我的应用程序(工作):yarnapplication-list总是返回空的
我正在尝试安装Hadoop以使用HDFS服务。我在Windows上的Ubuntu上的Bash(不是VM)上做这件事:https://www.microsoft.com/fr-fr/store/p/ubuntu/9nblggh4msv6我遵循的教程是这个(它与大多数Hadoop安装教程非常相似):https://www.youtube.com/watch?v=Nb1sinaTlmo所以一切顺利,直到我尝试运行start-dfs.sh但我收到以下错误消息:17/12/1222:19:06WARNutil.NativeCodeLoader:Unabletoloadnative-hadoopl
我是spark的新手,在使用cloudera管理器中提供的包裹安装spark之后。我已经配置了以下来自clouderaenterprise的链接中所示的文件:http://www.cloudera.com/content/cloudera-content/cloudera-docs/CM4Ent/4.8.1/Cloudera-Manager-Installation-Guide/cmig_spark_installation_standalone.html完成此设置后,我通过运行/opt/cloudera/parcels/SPARK/lib/spark/sbin/start-all.s
我阅读了其他关于Hadoop的HDFS配置问题的帖子。然而,他们都没有帮助。所以,我发布我的问题。我关注了thishadoopv1.2.1教程。当我运行hadoopfs-ls命令时出现此错误:16/08/2915:20:35INFOipc.Client:Retryingconnecttoserver:localhost/127.0.0.1:9000.Alreadytried0time(s);retrypolicyisRetryUpToMaximumCountWithFixedSleep(maxRetries=10,sleepTime=1SECONDS)我的core-site.xml文件
localhost:9870工作正常。问题是本地主机:8088。他们和9870一样移动了吗? 最佳答案 没有。如ApacheHadoop3.0.0中所述:Defaultportsofmultipleserviceshavebeenchanged.Previously,thedefaultportsofmultipleHadoopserviceswereintheLinuxephemeralportrange(32768-61000).Thismeantthatatstartup,serviceswouldsometimesfailt
我已经建立了一个双节点hadoop集群。我启动了hadoop文件系统和mapreduceddaemons没有错误,并验证它们正在主从上运行。我可以使用命令bin/hadoopdfs-getmergehdfs://my.domain.com:54310/user/wordcount/sunzi.txt/tmp/wordcount从主节点和从节点读取输入文件。当我运行mapreduce作业时,我在输出中看到错误。作业最终完成,但reduce部分花费了很长时间,并且每次打印错误时它都会继续返回map任务。我的站点配置文件引用了master的dns名称,所以我不知道为什么作业要尝试从“loca
我想找出maptask的进度。如果有人可以帮助我,那就太好了!谢谢!! 最佳答案 我们可以通过两种方式监控作业中Map和Reduce的进度。首先是网络界面。http://pdhadoop1:50030其中pdhadoop1是您的名称节点机器。另一种方式是从作业驱动程序内部,可以输出到控制台(或其他地方)作业提交后,我们进入while循环并检查job.isComplete()。在循环中我们做System.out.println(String.format("ProgressofPageviewsETLJob%s:",job.getJo