草庐IT

datanode-namenode

全部标签

Hadoop:datanode 进程正在运行但不工作?

这几天一直在尝试安装hadoop集群。有时成功,但大多数时候失败。我根据官方文档和一些貌似高质量的博客进行了配置。我遇到的问题是:所有进程(包括namenode、datanode、nodemanager、resourcemanager)可以通过命令查看:jps但奴隶们实际上并没有工作。我在Web界面master:8088或master:50070中看不到它们有人说是重复的namenode格式和id冲突造成的。我认为这不是我的问题,因为数据节点从一开始就不起作用,而且数据节点文件夹始终是空的。这种现象还有其他可能的原因吗?我真的很难设置集群。详细信息:Hadoop版本:3.0.0-alp

Hadoop:为什么我在 Namenode Information Web 中收到 "Max Non Heap Memory is -1 B."消息?这是什么意思?

我有一个使用VirtualBox制作的Hadoop2.6.5集群(一个主节点用作名称节点和数据节点,两个从节点)(easch节点安装了Xubuntu16.04)。先验,安装是正确的,因为我运行了一个wordcount示例并且没问题。在master:50070(我看到名称节点信息的地方),我得到这个:"MaxNonHeapMemoryis-1B."你知道这是什么意思吗?我找不到答案,我想检查一下,因为在运行wordcount之后我尝试运行我自己的程序但它没有成功,尽管它在我的Hadoop单节点安装中运行正常。我希望清楚,如果您需要更多信息,请告诉我。谢谢! 最

hadoop - Namenode 关闭错误 - 以状态 0 退出(Hadoop 安装)

我正在尝试让Hadoop-2.8.1正常工作。我正在运行命令来配置Namenode。但是,当我从Hadoop目录运行Namenode时它会关闭。***********s-MacBook-Pro-2:~***********$cdDownloads/hadoop-2.8.1***********s-MacBook-Pro-2:hadoop-2.8.1***********$bin/hdfsnamenode-format17/09/1212:08:26INFOnamenode.NameNode:STARTUP_MSG:/***********************************

Hadoop-3.1.2 : Datanode and Nodemanager shuts down

我正在尝试在Windows-10上安装Hadoop(3.1.2),但数据节点和节点管理器关闭。我尝试下载winutils.exe和hadoop.dll文件并将其放在bin目录下。我也试过更改文件的权限并以管理员身份运行。但它并没有修复错误Datanode关闭错误2019-02-1212:01:30,856INFOchecker.ThrottledAsyncChecker:Schedulingacheckfor[DISK]file:/D:/Installs/IT/hadoop-3.1.2/data/datanode2019-02-1212:01:30,888WARNchecker.Sto

hadoop - 如果没有在hdfs-site.xml中定义,namenode和datanode安装在哪里?

我的hdfs-site.xml只有以下内容:dfs.replication1问题。NameNode和DataNode安装在哪里?我在装有Windows10的MSFTSurface笔记本电脑上使用Hadoop3.0.3版本。 最佳答案 在hdfs-default.xmldfs.datanode.data.dir默认值为file://${hadoop.tmp.dir}/dfs/data和dfs.namenode.name。目录file://${hadoop.tmp.dir}/dfs/name并且在core-default.xmlhado

hadoop - "hadoop namenode -format"目录格式错误

我正在尝试在CentOS6.3上安装Hadoop1.1.2.21我已经在/etc/hadoop/conf/hdfs-site.xml文件中配置了dfs.name.dirdfs.name.dir/mnt/ext/hadoop/hdfs/namenode但是当我运行“hadoopnamenode-format”命令时,它会格式化/tmp/hadoop-hadoop/dfs/name。我错过了什么? 最佳答案 我遇到了这个问题并解决了它。所以更新这个答案。确保您的环境变量HADOOP_CONF_DIR指向可以找到所有用于配置的xml文件的

hadoop - DataNode 未在任何节点上启动

当我使用伪节点配置时,所有守护进程都在启动,但任何时候我创建一个完全分布式模式的集群时,DataNode守护进程都不会在任何节点上启动,包括主节点。可能导致此行为的原因是什么? 最佳答案 确保namespaceID与所有节点中的/tmp/hadoop-hduser/dfs/data/current/VERSION和namespaceID匹配master中的/tmp/hadoop-hduser/dfs/data/current/VERSION和/tmp/hadoop-hduser/dfs/name/current/VERSION.

hadoop - [hdfs]如何为每个datanode配置不同的dfs.datanode.data.dir?

我使用ambari来设置hadoop集群。但是当我配置hdfs的配置时。我发现如果我修改dfs.datanode.data.dir,configure会在所有datanodes上生效...如何为每个数据节点配置不同的配置?比如机器A有两block磁盘,分别挂载到/data1、/data2但是机器B只有一个盘,挂载到/data1所以我想将机器A的dfs.datanode.data.dir配置为“/data1,/data2”。但只有机器B的“/data1” 最佳答案 不存在的HDFS目录将被忽略。都放进去,没关系。

hadoop - 在每个datanode中将数据写入本地磁盘

我想将map任务中的一些值存储到每个数据节点的本地磁盘中。例如,publicvoidmap(...){//ProcessListcache=newArrayList();//Addvaluetocache//Serializecachetolocalfileinthisdatanode}我如何将这个缓存对象存储到每个数据节点的本地磁盘,因为如果我像上面那样将这个缓存存储在map函数中,那么性能会很糟糕,因为I/O任务?我的意思是有没有办法等待这个数据节点中的map任务完全运行,然后我们将这个缓存存储到本地磁盘?或者Hadoop有没有解决这个问题的功能? 最佳

hadoop - YARN 和 NameNode 什么时候交互

提交作业时,YARN和NameNode什么时候交互?提交作业后,它会发送给谁?有人可以解释端到端流程-hadoop生态系统如何运作吗?谢谢! 最佳答案 Namenode:存储数据节点中存储的所有数据的元数据,监控数据节点的健康状况。基本上,它是一种主从架构。YARN:代表YetAnotherResourceNegotiator。yarn主要有两种成分。1.>调度2.>应用程序管理器Yarn还包含master,即ResourceManager和Slave,即NodeManager。出于调度目的,有3个调度器:1.>先进先出2.>容量3