草庐IT

fuse-dfs

全部标签

hadoop - 使用 hdfs dfs -test 查看目录是否存在

在hadoop文档中:testUsage:hadoopfs-test-[defsz]URIOptions:-d:fthepathisadirectory,return0.-e:ifthepathexists,return0.-f:ifthepathisafile,return0.-s:ifthepathisnotempty,return0.-z:ifthefileiszerolength,return0.Example:hadoopfs-test-efilename如果hdfs目录不存在,我想做点什么。-test选项中的每个参数都返回0。如果目录不存在,我该如何输出?drwx-----

Hadoop 错误 dfs -copyFromLocal

从临时目录移动hadoop中的文件时使用以下命令:-[Divya@localhosthadoop]$bin/hadoopdfs-copyFromLocal/tmp/gutenberg/home/Divya/gutenberg如何解决这个错误:-13/07/0314:42:28INFOipc.Client:Retryingconnecttoserver:localhost/127.0.0.1:54310.Alreadytried0time(s);retrypolicyisRetryUpToMaximumCountWithFixedSleep(maxRetries=10,sleepTime

hadoop - "dfs.replication"和 "dfs.datanode.data.dir"配置如何在集群中工作?

我已按照Apache“单节点设置”说明在单节点上设置dfs.replication。但是后来我按照“ClusterSetup”进行操作,但它没有提到这个属性,所以我不知道这是要在Namenode上设置的属性,还是也/仅在Datanodes上设置的属性..我还读到在数据节点上的dfs.datanode.data.dir中设置多个(逗号分隔)路径将复制所有路径上的数据。所以我的问题是:dfs.replication将对哪个节点产生影响,如果dfs.datanode.data.dir的多个路径是设置,这些额外的独立复制是否仅针对每个数据节点,或者这些是否也以某种方式与dfs.replicat

Hadoop : start-dfs. sh 连接被拒绝

我在debian/stretch64上有一个vagrantbox我尝试使用文档安装Hadoop3http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/SingleCluster.htm当我运行start-dfs.sh时我有这个消息vagrant@stretch:/opt/hadoop$sudosbin/start-dfs.shStartingnamenodeson[localhost]pdsh@stretch:localhost:connect:ConnectionrefusedStartingd

sockets - 运行 start-dfs.sh 时权限被拒绝错误

我在执行start-dfs.sh时遇到此错误Startingnamenodeson[localhost]pdsh@Gaurav:localhost:rcmd:socket:PermissiondeniedStartingdatanodespdsh@Gaurav:localhost:rcmd:socket:PermissiondeniedStartingsecondarynamenodes[Gaurav]pdsh@Gaurav:Gaurav:rcmd:socket:Permissiondenied2017-03-1309:39:29,559WARNutil.NativeCodeLoade

hadoop - 由于安全模式打开,无法从 dfs 中删除文件

我正在使用cloudera的VM来运行hadoop。99%的dfs空间已用完。所以我需要删除文件,但是删除文件需要关闭安全模式。我尝试使用以下命令关闭安全模式,sudo-uhdfshdfsdfsadmin-safemodeleave它说它已被关闭,但由于空间不足,它会自动将其打开。当我尝试删除文件时,它说由于安全模式已开启,您无法删除文件。SafeModeException:Cannotcreatedirectory/user/cloudera/.Trash/Current.Namenodeisinsafemode.ResourcesarelowonNN.Pleaseaddorfree

hadoop - master节点的"start-all.sh"和"start-dfs.sh"不启动slave节点服务?

我已经用我的从节点的主机名更新了Hadoop主节点上的/conf/slaves文件,但是我无法从主节点启动从节点。我必须单独启动从站,然后我的5节点集群启动并运行。如何使用主节点的单个命令启动整个集群?此外,SecondaryNameNode正在所有从节点上运行。那是问题吗?如果是这样,我怎样才能将它们从奴隶中移除?我认为一个集群中应该只有一个SecondaryNameNode和一个NameNode,对吗?谢谢! 最佳答案 在ApacheHadoop3.0中使用$HADOOP_HOME/etc/hadoop/workers文件每行添

hadoop - 如何从 DFS 而不是从 Mapred 中删除 hadoop 节点?

我是hadoop的新手。为了运行一些基准测试,我需要各种hadoop配置进行比较。我想知道一种从DFS(不再运行datanode守护进程)中删除hadoop从站但不从Mapred中删除(继续运行tasktracker)的方法,反之亦然。据我所知,此类hadoop节点只有一个从属文件,而DFS和Mapred没有单独的从属文件。目前,我正在尝试在从属节点上同时启动DFS和Mapred,然后在从属节点上终止数据节点。但是将该节点放入HDFSGUI上的“死节点”需要一段时间。可以调整任何参数以使此超时更快?谢谢 最佳答案 尝试使用dfs.h

hadoop - 为什么在运行 hadoop(或 dfs 命令)时一直显示 deprecated 错误

我已经安装了hadoop-2.0.0-alpha,但是每当我执行一个命令时,它都会给我弃用错误(尽管它看起来运行没有问题)$hadoop/bin/hadoopdfs-copyFromLocalinputinputDEPRECATED:Useofthisscripttoexecutehdfscommandisdeprecated.Insteadusethehdfscommandforit.$hadoop/bin/hadoopdfs-rmrinputDEPRECATED:Useofthisscripttoexecutehdfscommandisdeprecated.Insteaduseth

Hadoop dfs 复制

抱歉各位,这只是一个简单的问题,但我无法在谷歌上找到确切的问题。关于dfs.replication是什么意思的问题?如果我在hdfs中创建了一个名为filmdata.txt的文件,如果我设置dfs.replication=1,那么它是否完全是一个文件(一个filmdata.txt)?或者除了主文件(filmdata.txt)之外,hadoop将创建另一个复制文件.简而言之:如果设置dfs.replication=1,那么一共是一个filmdata.txt,还是两个filmdata.txt?提前致谢 最佳答案 文件系统中的文件总数将在