草庐IT

namenodes

全部标签

hadoop - 对 Hadoop namenode 内存使用的困惑

我对Hadoopnamenode内存计算有一个愚蠢的怀疑。它在Hadoop书(明确指南)中提到“由于名称节点在内存中保存文件系统元数据,文件系统中文件数量的限制由名称节点上的内存量决定。根据经验,每个文件、目录和block大约需要150字节。因此,例如,如果您有100万个文件,每个文件占用一个block,则您至少需要300MB的内存。虽然存储数百万个文件是可行的,但数十亿个文件超出了当前硬件的能力。”由于每取一个block,namenode最小内存应该是150MB而不是300MB。请帮我理解为什么是300MB 最佳答案 我猜你读过T

Hadoop NameNode 不启动

我目前正在尝试在AmazonEC2实例(多节点集群)上运行Hadoop2.6.0。我启动了两个Ubuntu14.04实例。其中一个是主人,另一个是奴隶。以下是我的配置:大师-核心站点.xmlfs.defaultFShdfs://hadoopmaster:9000-hdfs-site.xmldfs.replication1dfs.namenode.name.dirfile:/home/ubuntu/hadoop-2.6.0/hadoop_data/hdfs/namenode-yarn-site.xmlyarn.nodemanager.aux-servicesmapreduce_shuff

xml - 当我要格式化 namenode 时,我收到错误提示 org.xml.sax.SAXParseException

pc83@pc83-ThinkCentre-M92p:~/Application/hadoop-2.6.0/etc/hadoop$hadoopnamenode-formatDEPRECATED:Useofthisscripttoexecutehdfscommandisdeprecated.Insteadusethehdfscommandforit.15/10/0916:02:11INFOnamenode.NameNode:STARTUP_MSG:/************************************************************STARTUP_MS

Hadoop:为什么我在 Namenode Information Web 中收到 "Max Non Heap Memory is -1 B."消息?这是什么意思?

我有一个使用VirtualBox制作的Hadoop2.6.5集群(一个主节点用作名称节点和数据节点,两个从节点)(easch节点安装了Xubuntu16.04)。先验,安装是正确的,因为我运行了一个wordcount示例并且没问题。在master:50070(我看到名称节点信息的地方),我得到这个:"MaxNonHeapMemoryis-1B."你知道这是什么意思吗?我找不到答案,我想检查一下,因为在运行wordcount之后我尝试运行我自己的程序但它没有成功,尽管它在我的Hadoop单节点安装中运行正常。我希望清楚,如果您需要更多信息,请告诉我。谢谢! 最

hadoop - Namenode 关闭错误 - 以状态 0 退出(Hadoop 安装)

我正在尝试让Hadoop-2.8.1正常工作。我正在运行命令来配置Namenode。但是,当我从Hadoop目录运行Namenode时它会关闭。***********s-MacBook-Pro-2:~***********$cdDownloads/hadoop-2.8.1***********s-MacBook-Pro-2:hadoop-2.8.1***********$bin/hdfsnamenode-format17/09/1212:08:26INFOnamenode.NameNode:STARTUP_MSG:/***********************************

hadoop - 如果没有在hdfs-site.xml中定义,namenode和datanode安装在哪里?

我的hdfs-site.xml只有以下内容:dfs.replication1问题。NameNode和DataNode安装在哪里?我在装有Windows10的MSFTSurface笔记本电脑上使用Hadoop3.0.3版本。 最佳答案 在hdfs-default.xmldfs.datanode.data.dir默认值为file://${hadoop.tmp.dir}/dfs/data和dfs.namenode.name。目录file://${hadoop.tmp.dir}/dfs/name并且在core-default.xmlhado

hadoop - "hadoop namenode -format"目录格式错误

我正在尝试在CentOS6.3上安装Hadoop1.1.2.21我已经在/etc/hadoop/conf/hdfs-site.xml文件中配置了dfs.name.dirdfs.name.dir/mnt/ext/hadoop/hdfs/namenode但是当我运行“hadoopnamenode-format”命令时,它会格式化/tmp/hadoop-hadoop/dfs/name。我错过了什么? 最佳答案 我遇到了这个问题并解决了它。所以更新这个答案。确保您的环境变量HADOOP_CONF_DIR指向可以找到所有用于配置的xml文件的

hadoop - YARN 和 NameNode 什么时候交互

提交作业时,YARN和NameNode什么时候交互?提交作业后,它会发送给谁?有人可以解释端到端流程-hadoop生态系统如何运作吗?谢谢! 最佳答案 Namenode:存储数据节点中存储的所有数据的元数据,监控数据节点的健康状况。基本上,它是一种主从架构。YARN:代表YetAnotherResourceNegotiator。yarn主要有两种成分。1.>调度2.>应用程序管理器Yarn还包含master,即ResourceManager和Slave,即NodeManager。出于调度目的,有3个调度器:1.>先进先出2.>容量3

hadoop - 没有要停止的 Namenode 或 Datanode 或 Secondary NameNode

我按照以下链接中的步骤在我的Ubuntu12.04中安装了Hadoop。http://www.bogotobogo.com/Hadoop/BigData_hadoop_Install_on_ubuntu_single_node_cluster.php一切都已成功安装,当我运行start-all.sh时,只有一些服务在运行。wanderer@wanderer-Lenovo-IdeaPad-S510p:~$su-hdusePassword:hduse@wanderer-Lenovo-IdeaPad-S510p:~$cd/usr/local/hadoop/sbinhduse@wanderer

hadoop - Hadoop 2.x 中的辅助 NameNode 使用和高可用性

你能帮我解决以下情况吗?1)在使用HadoopV2的同时,我们在生产环境中使用SecondaryNameNode吗?2)对于HadoopV2,假设我们在主动/被动连接中使用多个NameNode以实现高可用性,并且当编辑日志文件变得越来越大时,编辑日志如何应用到f​​simage?如果是这样,那么在Namenode启动期间将巨大的Edits日志应用到Namenode会很耗时吗?(我们在hadoopv1中有SecondaryNameNode来解决这个问题) 最佳答案 回答您的问题:1)在使用HadoopV2时,我们是否在生产环境中使用S