namenodes

hadoop - 为什么Hadoop对于datanode间和datanode-namenode通信有不同的通信机制？

datanode-namenode通信使用org.apache.hadoop.ipc包；而数据节点间的通信是基于简单的套接字通信。这样设计背后的动机是什么？最佳答案根据他们的要求有两个不同的任务，因此可以通过更好地满足要求的愿望来解释两个不同的实现。DataNode->NameNode通信比DataNode-DataNode通信更复杂，因此证明RPC是合理的。DataNode-DataNode通信一方面极其简单，另一方面需要高效传输大量数据。可以说套接字是这种情况下最有效的解决方案。

ubuntu - namenode，datanode 不使用 jps 列出

环境:ubuntu14.04，hadoop2.6在我输入start-all.sh和jps后，DataNode没有在终端上列出>jps9529ResourceManager9652NodeManager9060NameNode10108Jps9384SecondaryNameNode根据这个答案:DatanodeprocessnotrunninginHadoop我试其最佳解bin/stop-all.sh(或2.x系列中的stop-dfs.sh和stop-yarn.sh)rm-Rf/app/tmp/hadoop-your-username/*bin/hadoopnamenode-forma

namenode datanode hadoop localhost local ubuntu hdfs

hadoop - cdh4.3，日志异常，./start-dfs.sh后，datanode和namenode启动失败

这是来自hadoop-datanode-...log的日志:FATALorg.apache.hadoop.hdfs.server.datanode.DataNode:block池初始化失败block池BP-1421227885-192.168.2.14-1371135284949(存储IDDS-30209445-192.168.2.41-50010-1371109358645)服务于/192.168.2.8:8020org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.protocol.Disallowe

start-dfs datanode section hadoop apache hdfs

hadoop - 失败后hadoop namenode dirs是否同步？

在这种情况下会发生什么:Namenode正在写入两个不同驱动器上的两个目录，一个是本地的，另一个(远程)是mounted。现在，namenode失败了，我们在远程机器上启动namenode进程(它有原始namenode数据的副本，所以它是安全的)并更改所有datanodes上的namenode的ip。一段时间后，我们设法使原来的名称节点与之前的配置完全一致。我们停止远程机器上的名称节点进程。现在，本地fs.name.dir是否会与挂载的同步(我的意思是在挂载目录上累积的差异，而原始名称节点已关闭)还是名称节点数据一致性会出现问题？最佳答案

hadoop namenode section blockquote backup redundancy

ubuntu - Hadoop : NameNode , DataNode 和 SecondaryNameNode 未运行

我正在尝试使用本教程在我的计算机上的单节点集群上安装Hadoop2.2.0http://codesfusion.blogspot.gr/2013/10/setup-hadoop-2x-220-on-ubuntu.html?m=1.我一步一步地按照看到的每条说明进行操作，但每次都遇到同样的问题。NameNode、DataNode和SecondaryNameNode未运行。当我输入start-dfs.sh、start-yarn.sh和jps时，我看到的消息是:hduser@victor-OEM:/usr/local/hadoop/sbin$start-dfs.shIncorrectconf

SecondaryNameNode DataNode hadoop section hduser ubuntu

Hadoop 无法格式化 namenode - java.lang.NullPointerException

关于我的安装的一些细节:Ubuntu14.04LTS64位甲骨文JavaJDK1.8.0_40Hadoop2.6.0我一直在按照http://www.bogotobogo.com/Hadoop/BigData_hadoop_Install_on_ubuntu_single_node_cluster.php的说明进行操作安装Hadoop。一切正常，直到我必须格式化名称节点为止。当我运行$hadoopnamenode-format时，出现以下错误:DEPRECATED:Useofthisscripttoexecutehdfscommandisdeprecated.Insteadusethe

NullPointerException namenode hadoop local share

hadoop - Datanode 没有连接到 Namenode cloudera

我想通过Talend从远程机器访问cloudera以获取大数据。为此，我通过编辑文件/etc/hosts和/etc/sysconfig/network更改了cloudera中主机的ip。我可以从Talend访问cloudera。但是问题是我的数据节点和名称节点似乎没有连接。当我检查我的Datanode的日志详细信息时，出现以下错误:BlockpoolBP-1183376682-127.0.0.1-1433878467265(DatanodeUuidnull)servicetoquickstart.cloudera/127.0.0.1:8022beginninghandshakewith

Datanode Namenode section cloudera code hadoop configuration talend

hadoop - Namenode 为所有文件 block 存储元数据

在阅读《Hadoop:权威指南》这本书时，我遇到了这个page使用以下行:名称节点也知道给定文件的所有block所在的数据节点，但是，它不会持久存储block位置，因为此信息是在系统启动时从数据节点重建的。我很难理解这是如何工作的。比方说，我在复制因子为3的8节点集群上复制了一个1GB的文件。因此每个数据节点将有1个block，这些block将被复制到其他节点上，从而使每个节点上的block总数有效地达到3.现在namenode应该保留一个包含每个block位置的索引。但是根据文本，如果namenode不存储block位置持久，那么在集群关闭并重新启动后它们将如何重建。无法判断哪个bl

Namenode hadoop block section 20 hdfs

hadoop - 运行命令 stop-all.sh 时没有 JobTracker 和 NameNode 停止

在我的案例中，jobtracker和namenode已启动，但无法通过运行stop-all.sh命令停止它当我键入jps时得到以下消息:[root@iqhadoop]#jps25258JobTracker8082SecondaryNameNode7944DataNode8404Jps8321TaskTracker24237NameNode但是当我尝试通过在命令行上运行stop-all.sh来停止它时，收到以下消息:[root@iqbin]#bashstop-all.shnojobtrackertostoplocalhost:stoppingtasktrackernonamenodeto

JobTracker NameNode section hadoop stop

hadoop - hadoop namenode -format 命令查询

在执行“hadoopnamenode-format”时，出现以下消息。Re-formatfilesysteminStorageDirectory/opt/data/temp/dfs/name?(YorN)这里应该给什么？"is"或“否”。如果给定Y，它会丢失HDFS中的数据吗？最佳答案仅当dfs.namenode.name.dir已经存在时才会提示此问题，即目录已经格式化或现有目录映射到dfs.namenode.name.dir.如果您希望再次重新格式化，请输入YelseN。在给出Y时，目录将被格式化，删除所有现有的元数据(fs

hadoop namenode code section hdfs

19 20 212223 24 25