草庐IT

NameNode

全部标签

hadoop - hdfs(namenode)中使用的命名空间和元数据的含义是什么

作为hadoop的初学者,我对命名空间和元数据这两个词感到困惑。这两者之间有什么关系吗? 最佳答案 根据“Hadoop权威指南”——“NameNode管理文件系统命名空间。它维护文件系统树以及树中所有文件和目录的元数据。”本质上,Namespace就是一个容器。在此上下文中,它表示文件名分组或层次结构。元数据包含文件所有者、权限位、block位置、大小等内容。 关于hadoop-hdfs(namenode)中使用的命名空间和元数据的含义是什么,我们在StackOverflow上找到一个类

apache - HADOOP/YARN - ResourceManager 和 hdfs NameNode 是否总是安装在同一台主机上?

“资源管理器”和“hdfsnamenode”是否总是安装在同一台主机上?1)当我想向getnewapplicationid发送http请求(YARNRESTAPI)时我正在使用这个网络uri:http:///ws/v1/cluster/apps/new-application此端口是Resource-ManagerWebUI的http端口,默认值为8088,如img1所示:sourceforimg12)当我想为hdfs命令发送一个http请求(WebHDFSRESTAPI)时,例如getfilestatus我正在使用这个网络uri:http://:/webhdfs/v1/?op=GET

java - 尝试格式化 namenode 时找不到或加载主类; hadoop 在 MAC OS X 10.9.2 上的安装

我正在尝试使用hadoop在我的MACOSX10.9.2上完成开发单节点集群设置。我尝试了各种在线教程,最近的是thisone.总结一下我所做的:1)$brewinstallhadoop这在/usr/local/Cellar/hadoop/2.2.0中安装了hadoop2.2.02)配置的环境变量。这是我的.bash_profile的相关部分:###Java_HOMEexportJAVA_HOME="$(/usr/libexec/java_home)"###HADOOPEnvironmentvariablesexportHADOOP_PREFIX="/usr/local/Cellar/

hadoop - hdfs Datanode 拒绝与 namenode 通信,因为无法解析主机名

我在LXC容器内的一台机器上有3个DataNode和1个NameNode。与NameNode位于同一节点上的DataNode工作正常,但我没有得到其他2个:InitializationfailedforBlockpoolBP-232943349-10.0.3.112-1417116665984(DatanodeUuidnull)servicetohadoop12.domain.local/10.0.3.112:8022Datanodedeniedcommunicationwithnamenodebecausehostnamecannotberesolved(ip=10.0.3.233,

hadoop - hadoop的namenode的内存消耗?

谁能详分割析一下namenode的内存消耗?或者有什么引用资料吗?网络上找不到资料,谢谢! 最佳答案 我想内存消耗将取决于您的HDFS设置,因此取决于HDFS的整体大小并且与block大小相关。来自HadoopNameNodewiki:UseagoodserverwithlotsofRAM.ThemoreRAMyouhave,thebiggerthefilesystem,orthesmallertheblocksize.来自https://twiki.opensciencegrid.org/bin/view/Documentatio

hadoop - 配置不正确 : namenode address dfs. namenode.rpc-address没有配置

当我尝试启动DataNode时出现此错误。据我所知,RPC参数仅用于HA配置,我没有设置(我认为)。2014-05-1818:05:00,589INFO[main]impl.MetricsSystemImpl(MetricsSystemImpl.java:shutdown(572))-DataNodemetricssystemshutdowncomplete.2014-05-1818:05:00,589INFO[main]datanode.DataNode(DataNode.java:shutdown(1313))-Shutdowncomplete.2014-05-1818:05:00

hadoop - dfs.namenode.servicerpc-address 或 dfs.namenode.rpc-address 未配置

我试图用一个名称节点和四个数据节点配置hadoop。我能够在一台机器上成功配置名称节点和作业跟踪器并将其启动。但是在我要配置数据节点的机器上,我做了以下操作:我将hadoop-2.0.0-cdh4.1.2.tar.gz和mr1-2.0.0-mr1-cdh4.1.2.tar.gz解压到一个文件夹并设置主从配置。在master文件中,我设置了配置为名称节点的机器的IP地址。在从属机器中,我设置了我解压缩tar球的机器的IP地址。当我尝试使用命令启动数据节点时hdfsdatanode我收到这个错误:java.io.IOException:Incorrectconfiguration:name

hadoop java.io.IOException : while running namenode -format 错误

我运行了namenode-format。这是我的输出。我尝试更改文件权限chmod777hadoop。我相信这一行是错误的错误namenode.NameNode:java.io.IOException:无法创建目录/your/path/to/hadoop/tmp/dir/hadoop-hadoop/dfs/name/currentadoop@alexander-desktop:/usr/local/hadoop/bin$./hadoopnamenode-format12/07/0317:03:56INFOnamenode.NameNode:STARTUP_MSG:/**********

Hadoop Datanode、namenode、secondary-namenode、job-tracker 和 task-tracker

我是hadoop的新手,所以我有一些疑问。如果主节点发生故障,hadoop集群会发生什么?我们能否在没有任何损失的情况下恢复该节点?是否可以保留一个辅助主节点在当前主节点发生故障时自动切换为主节点?我们有namenode(Secondarynamenode)的备份,所以我们可以在Secondarynamenode发生故障时从中恢复namenode。这样,当datanode发生故障时,我们如何恢复datanode中的数据呢?Secondarynamenode只是namenode的备份而不是datenode,对吧?如果一个节点在作业完成之前发生故障,那么作业跟踪器中有待处理的作业,该作业是

networking - Hadoop Datanodes找不到NameNode

我在VirtualBox中设置了一个分布式Hadoop环境:4个虚拟Ubuntu11.10安装,一个作为主节点,另外三个作为从属节点。我关注了thistutorial启动并运行单节点版本,然后转换为完全分布式版本。当我运行11.04时它工作得很好;然而,当我升级到11.10时,它坏了。现在我所有的奴隶日志都显示以下错误信息,重复得令人作呕:INFOorg.apache.hadoop.ipc.Client:Retryingconnecttoserver:master/192.168.1.10:54310.Alreadytried0time(s).INFOorg.apache.hadoop