hdfs_clusters_草庐IT

hadoop - HDFS_NAMENODE_USER、HDFS_DATANODE_USER 和 HDFS_SECONDARYNAMENODE_USER 未定义

我是hadoop新手。我正在尝试以伪分布式模式在我的笔记本电脑中安装hadoop。我使用root用户运行它，但出现以下错误。root@debdutta-Lenovo-G50-80:~#$HADOOP_PREFIX/sbin/start-dfs.shWARNING:HADOOP_PREFIXhasbeenreplacedbyHADOOP_HOME.UsingvalueofHADOOP_PREFIX.Startingnamenodeson[localhost]ERROR:AttemptingtooperateonhdfsnamenodeasrootERROR:butthereisnoHDF

hadoop - 在 hdfs 中重命名目录

我需要重命名hdfs中的一个目录。那是什么命令？hadoopfs-mv上述命令将src文件夹移动到dest文件夹。相反，我希望将src文件夹重命名为dest。最佳答案 rename不在hadoop中，但是可以移动，hadoopfs-mv旧名新名关于hadoop-在hdfs中重命名目录，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/27286946/

命名 hadoop section code command hdfs

hadoop - HDFS 中的高吞吐量与低延迟

我试图用自己的话来定义HDFS中高吞吐量与低延迟的含义，并提出了以下定义:HDFSisoptimizedtoaccessbatchesofdatasetquicker(highthroughput),ratherthenparticularrecordsinthatdataset(lowlatency)有意义吗？:)谢谢! 最佳答案我认为您所描述的更像是针对不同访问模式(顺序、批处理与随机访问)进行优化之间的差异，而不是最纯粹意义上的吞吐量和延迟之间的差异。当我想到一个高延迟系统时，我并没有考虑我正在访问的是哪条记录，而是访问任何

hadoop HDFS code section 吞吐 low-latency throughput

hadoop - 如何在 Hadoop HDFS 中导航目录

我想在HDFS中导航首先我查看了“根”HDFS中的目录[cloudera@localhost~]$sudo-uhdfshadoopfs-lshdfs:/Found5itemsdrwxr-xr-x-hbasehbase02015-10-1007:03hdfs:///hbasedrwxr-xr-x-solrsolr02014-06-0116:16hdfs:///solrdrwxrwxrwx-hdfssupergroup02015-10-0811:45hdfs:///tmpdrwxr-xr-x-hdfssupergroup02015-04-1308:26hdfs:///userdrwxr-x

中导何在 hdfs code java hadoop

hadoop - hdfs - ls : Failed on local exception: com. google.protobuf.InvalidProtocolBufferException:

我正在尝试使用下面的命令在hdfs中列出我的目录:ubuntu@ubuntu:~$hadoopfs-lshdfs://127.0.0.1:50075/ls:Failedonlocalexception:com.google.protobuf.InvalidProtocolBufferException:Protocolmessageend-grouptagdidnotmatchexpectedtag.;HostDetails:localhostis:"ubuntu/127.0.0.1";destinationhostis:"ubuntu":50075;这是我的/etc/hosts文件1

InvalidProtocolBufferException exception section ubuntu code hadoop hdfs cloudera

hadoop - 删除 HDFS 上超过 10 天的文件

有没有办法删除HDFS上超过10天的文件？在Linux中我会使用:find/path/to/directory/-typef-mtime+10-name'*.txt'-execdirrm--{}\;有没有办法在HDFS上执行此操作？(根据文件创建日期进行删除) 最佳答案解决方案1:使用多个命令由daemon12回答hdfsdfs-ls/file/Path|tr-s""|cut-d''-f6-8|grep"^[0-9]"|awk'BEGIN{MIN=14400;LAST=60*MIN;"date+%s"|getlineNOW}{cm

hadoop HDFS section 39 34

hadoop - Hadoop 2.2.0 HDFS 的配置文件在哪里？

我正在研究Hadoop，目前正在尝试设置Hadoop2.2.0单节点。我下载了最新的发行版，解压缩了它，现在我正在尝试设置Hadoop分布式文件系统(HDFS)。现在，我正在尝试遵循可用的Hadoop说明here但我迷路了。在左侧栏中，您会看到对以下文件的引用:核心默认.xmlhdfs-default.xmlmapred-default.xmlyarn-default.xml但是这些文件是怎样的？我找到了/etc/hadoop/hdfs-site.xml，但是它是空的!我找到了/share/doc/hadoop/hadoop-project-dist/hadoop-common/cor

hadoop section configuration hdfs configuration-files

hadoop - 无法找到或加载主类 org.apache.hadoop.hdfs.server.namenode.Namenode

我知道之前有人问过这个问题，但我想不出解决方案。当我尝试运行hdfsnamenode-format时出现以下错误:Couldnotfindorloadmainclassorg.apache.hadoop.hdfs.server.namenode.NamenodeIfollowedtheinstructionsfromthiswebsitetoinstallonmycentosmachine.唯一的区别是我使用root而不是链接中提到的hadoopuser安装。Bashrc#UserspecificaliasesandfunctionsexportJAVA_HOME=/usr/lib/j

hadoop Namenode code gt

hadoop/hdfs/name 处于不一致状态 : storage directory(hadoop/hdfs/data/) does not exist or is not accessible

我已经尝试了stackoverflow提供的关于这个主题的所有不同解决方案，但没有帮助再次询问具体日志和详细信息感谢任何帮助我的Hadoop集群中有一个主节点和5个从节点。ubuntu用户和ubuntu组是~/Hadoop文件夹的所有者~/hadoop/hdfs/data&~/hadoop/hdfs/name文件夹都存在两个文件夹的权限都设置为755在启动脚本start-all.sh之前成功格式化namenode脚本无法启动“名称节点”这些都在主节点上运行ubuntu@master:~/hadoop/bin$jps7067TaskTracker6914JobTracker7237Jps

hadoop hdfs namenode apache nodes

compression - Hadoop:在 HDFS 中压缩文件？

我最近在Hadoop中设置了LZO压缩。在HDFS中压缩文件的最简单方法是什么？我想压缩一个文件，然后删除原来的。我应该使用IdentityMapper和使用LZO压缩的IdentityReducer创建MR作业吗？最佳答案对我来说，编写HadoopStreaming的开销较低压缩文件的作业。这是我运行的命令:hadoopjar$HADOOP_HOME/contrib/streaming/hadoop-streaming-0.20.2-cdh3u2.jar\-Dmapred.output.compress=true\-Dmapr

中压 compression section hadoop Dmapred