草庐IT

hdfs_clusters

全部标签

hadoop - HDFS 主目录

我已经设置了一个单节点多用户hadoop集群。在我的集群中,有一个管理员用户负责运行集群(super用户)。所有其他用户都分配了一个hdfs目录,例如/home/xyz,其中xyz是用户名。在unix中,我们可以在/etc/passwd中更改用户的默认主目录。默认情况下,用户的登陆目录是主目录。我如何在hadoop中为hdfs文件系统做这件事。我想要例如,如果用户类型:$hadoopdfs-ls在unix提示符下。它应该列出我分配的主目录的内容。此外,hdfs目录由运行集群的super用户(hadoopsuper用户而非unixroot)创建,然后将所有权转移给特定用户。

c++ - Hadoop C++ HDFS测试运行异常

我正在使用Hadoop2.2.0并尝试运行这个hdfs_test.cpp应用程序:#include"hdfs.h"intmain(intargc,char**argv){hdfsFSfs=hdfsConnect("default",0);constchar*writePath="/tmp/testfile.txt";hdfsFilewriteFile=hdfsOpenFile(fs,writePath,O_WRONLY|O_CREAT,0,0,0);if(!writeFile){fprintf(stderr,"Failedtoopen%sforwriting!\n",writePath

hadoop - 将文件从 FTP 复制到 HDFS

IneedtocopyfilesfromFTPseveroutsidemyclustertoHadoopi.eHDFS.提前致谢。 最佳答案 你试过吗?FTPTOHDFS...您可以修改此代码并将File的参数更改为FTPaagrs[0],将HDFSPaht更改为args[1]。而不是将它作为hadoopjar运行。希望这会有所帮助... 关于hadoop-将文件从FTP复制到HDFS,我们在StackOverflow上找到一个类似的问题: https://s

hadoop - HDFS:使用 HDFS API 附加到 SequenceFile

我一直在尝试使用JavaAPI在HDFS上创建和维护序列文件,而不运行MapReduce作业作为futureMapReduce作业的设置。我想将MapReduce作业的所有输入数据存储在单个序列文件中,但数据会在一天中随着时间的推移而附加。问题是,如果存在SequenceFile,则以下调用只会覆盖SequenceFile而不是附加到它。//fsandconfaresetupforHDFS,notasaLocalFileSystemseqWriter=SequenceFile.createWriter(fs,conf,newPath(hdfsPath),keyClass,valueCl

hadoop - hdfs 将多个文件复制到同一目标目录

我了解到,如果您想将多个文件从一个hadoop文件夹复制到另一个hadoop文件夹,您最好创建一个包含大量组件的大型“hdfsdfs-cp”语句,而不是创建多个hdfsdfs-cp语句。“更好”是指它会缩短复制文件所需的总时间:一个命令比多个单独的-cp命令依次运行要快。当我这样做并且我的目标目录对于我要复制的所有文件都是相同的时,我会收到警告。我正在执行以下命令:hdfsdfs-cp-f/path1/file1/pathx/target/path2/file2/pathx/target/path3/file3/pathx/target执行后我收到以下警告:cp:`/pathx/tar

hadoop - 错误 org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode : Exception in doCheckpoint

我在集群设置中使用Hadoop2.2.0,我反复收到以下错误,异常是在文件/opt/dev/hadoop/2.2.0/logs/下的名称节点olympus中产生的hadoop-deploy-secondarynamenode-olympus.log例如2014-02-1216:19:59,013INFOorg.mortbay.log:StartedSelectChannelConnector@olympus:500902014-02-1216:19:59,013INFOorg.apache.hadoop.hdfs.server.namenode.SecondaryNameNode:We

hadoop - 当我将文件存储在 HDFS 中时,它们会被复制吗?

我是Hadoop新手。当我使用hadoop-fsputcommoad存储Excel文件时,它存储在HDFS中。复制因子为3。我的问题是:是否需要3个副本并将它们分别存储到3个节点中? 最佳答案 这是HDFS工作的漫画。https://docs.google.com/file/d/0B-zw6KHOtbT4MmRkZWJjYzEtYjI3Ni00NTFjLWE0OGItYTU5OGMxYjc0N2M1/edit?pli=1 关于hadoop-当我将文件存储在HDFS中时,它们会被复制吗?,

hadoop - 如何检查hdfs是否正在运行?

我想看看Hadoop的hdfs文件系统是否正常工作。我知道jps列出了正在运行的守护进程,但我实际上并不知道要查找哪些守护进程。我运行了以下命令:$HADOOP_PREFIX/sbin/hadoop-daemon.sh启动namenode$HADOOP_PREFIX/sbin/hadoop-daemon.sh启动数据节点$HADOOP_PREFIX/sbin/yarn-daemon.sh启动资源管理器$HADOOP_PREFIX/sbin/yarn-daemon.sh启动节点管理器输入jps时只出现namenode,resourcemanager,nodemanager应该运行哪些守护

hadoop - HDFS 下复制 block

我在我的“集群”上使用ClouderaManager免费版,所有服务都在我的单台机器上。我的机器充当数据节点、名称节点以及辅助名称节点。HDFS中与复制相关的设置,dfs.replication-1dfs.replication.min,dfs.namenode.replication.min-1dfs.replication.max-1我仍然得到复制不足的block,因此健康状况不佳,Namenode日志说,Requestedreplication3exceedsmaximum1java.io.IOException:file/tmp/.cloudera_health_monitor

java - 在 hadoop 中连接到 HDFS 时出现 EOFException

我在附带的测试程序中尝试将文件从本地磁盘复制到HDFS。代码如下:packagefoo.foo1.foo2.test;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;publicclassTestTestTest{publicstaticvoidmain(String[]args){StringsrcLocation="foo";Stringdestinati