fuse-dfs

hadoop - [hdfs]如何为每个datanode配置不同的dfs.datanode.data.dir？

我使用ambari来设置hadoop集群。但是当我配置hdfs的配置时。我发现如果我修改dfs.datanode.data.dir，configure会在所有datanodes上生效...如何为每个数据节点配置不同的配置？比如机器A有两block磁盘，分别挂载到/data1、/data2但是机器B只有一个盘，挂载到/data1所以我想将机器A的dfs.datanode.data.dir配置为“/data1,/data2”。但只有机器B的“/data1” 最佳答案不存在的HDFS目录将被忽略。都放进去，没关系。

datanode 何为 section data hadoop hdfs configure

hadoop - hdfs dfs -getmerge 命令有什么作用？

作为配置单元查询的结果，我得到了多个输出文件(按排序方式分发)，现在我想合并它们以生成一个文件。所以我尝试了hdfsdfs-getmerge命令。现在我想了解-getmerge是在连接之前对文件进行排序还是只是连接？最佳答案 publicstaticbooleanMore...copyMerge(FileSystemsrcFS,PathsrcDir,277FileSystemdstFS,PathdstFile,278booleandeleteSource,279Configurationconf,StringaddString)t

getmerge hadoop section contents srcDir hdfs

hadoop - 在 hadoop 中释放 "Non-DFS used"空间

我正在尝试将我们的数据加载到hadoophdfs中。经过一些测试运行，当检查hadoopwebui时，我意识到标题“使用的非DFS”下占用了大量空间。事实上，“Non-DFSused”比“DFSused”要多。因此，几乎一半的集群被非DFS数据消耗。即使在重新格式化namenode并重新启动之后，这个“非DFS”空间也没有被释放。此外，我无法找到存储此“非DFS”数据的目录，因此我无法手动删除这些文件。我在网上阅读了很多陷入完全相同问题的人的帖子，但没有一个得到明确的答案。清空这个“非DFS”空间有那么难吗？还是我不应该删除它？我怎样才能释放这个空间？最佳

hadoop amp DFS section strong hdfs

Hadoop:连接到主机 localhost 端口 22:运行 start-dfs.sh 时连接被拒绝

当使用start-dfs.sh启动最新的(2014年10月)Hadoop时，我们看到:connecttohostlocalhostport22:Connectionrefusedwhenrunning 最佳答案安装openssh服务器。对于Ubuntu命令是:sudoapt-getinstallopenssh-server在hadoop-env.sh文件中(存在于/etc/hadoop中)添加以下行:exportHADOOP_SSH_OPTS="-p22" 关于Hadoop:连接到主机

localhost start-dfs section code stackoverflow hadoop

hadoop - cdh4.3，日志异常，./start-dfs.sh后，datanode和namenode启动失败

这是来自hadoop-datanode-...log的日志:FATALorg.apache.hadoop.hdfs.server.datanode.DataNode:block池初始化失败block池BP-1421227885-192.168.2.14-1371135284949(存储IDDS-30209445-192.168.2.41-50010-1371109358645)服务于/192.168.2.8:8020org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.protocol.Disallowe

start-dfs datanode section hadoop apache hdfs

hadoop - org.apache.hadoop.hdfs.server.common.InconsistentFSStateException : Directory/tmp/hadoop/dfs/name is in an inconsistent state

我正在运行单节点。NameNode总是在启动集群时开始失败。我收到以下错误。2013-06-2910:37:29,968FATALorg.apache.hadoop.hdfs.server.namenode.NameNode:Exceptioninnamenodejoinorg.apache.hadoop.hdfs.server.common.InconsistentFSStateException:Directory/tmp/hadoop/dfs/nameisinaninconsistentstate:storagedirectorydoesnotexistorisnotaccess

hadoop InconsistentFSStateException NameNode

ubuntu - apt-get install hadoop-0.20-fuse - 找不到包

我需要安装一个“可挂载的HDFS”。四处搜索，我最终找到了几个教程:https://ccp.cloudera.com/display/CDHDOC/Mountable+HDFShttp://xmodulo.blogspot.de/2012/06/how-to-mount-hdfs-using-fuse.html(和其他类似的)它们都以sudoapt-getinstallhadoop-0.20-fuse开头。但这是行不通的。我收到错误消息:找不到包。我还是Linux的新手。我怎样才能让我的Ubuntu找到这个包？(全新安装的Ubuntu12.10LTS。从那时起我唯一做的就是安装和配置H

apt-get install code fuse section ubuntu hadoop hdfs

hadoop - Hive 输出大于 dfs block 大小限制

我有一个在配置单元中创建的表test。它由idate分区，经常需要插入分区。这可以将文件留在只有几行的hdfs上。hadoopfs-ls/db/test/idate=1989-04-01Found3items-rwxrwxrwx3deployersupergroup7102015-04-2611:33/db/test/idate=1989-04-01/000000_0-rwxrwxrwx3deployersupergroup7102015-04-2611:33/db/test/idate=1989-04-01/000001_0-rwxrwxrwx3deployersupergroup7

hadoop block code idate section hive hdfs partitioning

hadoop - Hbase- 即使删除列族后 Hadoop DFS 大小也没有减少

我们在EC2上有一个带有6个区域服务器的小型Hbase集群。最近我们发现其中一个列族中的数据对我们来说真的没有那么有用，因此决定放弃它。这个特定的列族占用了超过50%的磁盘空间。我们更改了表，删除了列族并运行了主要压缩。我们还对“-ROOT-”和“.META”进行了主要压缩。表。但是DFS文件总大小仍然没有减少？我们在这里错过了什么吗？任何帮助/指点将不胜感激。问候。最佳答案只是添加另一件事来检查-至少在Hbase0.90.4中，删除表会从HDFS中删除文件，但.logs目录的内容不一定。例如，运行hadoopfs-du/you

即使 hadoop section stackoverflow Hbase

eclipse - 无法查看从 Eclipse 连接到 Hadoop 的 DFS 位置上的任何文件夹

我在安装了CYGWIN的Windows中设置了Hadoop1.2.1。我已经启动了sshd服务。还启动了namenode、datanode、mapreduce(jobtracker、tasktracker)。我可以通过以下网址查看namenode、datanode和mapreduce的运行状态。当我尝试通过eclipse连接hadoop时，我能够。虽然我能够从eclipse连接hadoop，但我在打开DFS位置时没有看到任何文件夹。它显示为(0)(引用图片#1，我想没有可用的目录/文件。同样我检查了名称节点存储(引用图片#2)即使我尝试通过CYGWIN终端创建目录(引用图片#4)，我也

eclipse section hadoop apache cygwin hadoop-plugins

28 29 303132 33 34