Hdfs

hadoop - HDFS HA 可能性

最近，我成功地为HDFS和YARN启用了HA。现在我有一个事件的和备用的名称节点，自动故障转移工作正常。我正在使用ClouderaManager和CDH5。我有以下问题。例如，如果我的事件Namenode崩溃而备用Namenode变为事件状态，是否可以自动设置先前崩溃的Namenode以在它变得健康时将自己提升为事件状态？这样，一开始配置为备用的Namenode在关键情况下就可以简单地作为替代。期待您的回答! 最佳答案查看这篇文章以了解故障转移过程:HowdoesHadoopNamenodefailoverprocessworks

hadoop - cloudera垃圾检查点间隔配置

Cloudera允许我配置fs.trash.interval。但它不允许我配置fs.trash.checkpoint.interval。那么hdfs什么时候创建检查点呢？这里有一个类似的问题没有回应:WhendoesHadoopFrameworkcreatesacheckpoint(expunge)toits"current"directoryintrash? 最佳答案 ApacheHadoop文档包括左侧导航中指向各种*-default.xml文件的链接。这些文件包含所有配置属性的默认设置。如果您点击*-default.xml链接

cloudera hadoop trash interval checkpoint hdfs

hadoop - DC/OS 中机器重启的 HDFS 弹性

我已经在我的10台CoreOS机器(3个主节点，7个代理节点)的DCOS集群上安装了来自universe的HDFS。我的HAHDFS配置有2个名称节点、3个日志节点和5个数据节点。现在，我的问题是。HDFS不应该对机器重启有弹性吗？如果我重新启动安装了数据节点的机器，数据节点将被重建为其他节点的镜像(仅在从DC/OSUI重新启动HDFS服务之后)。在日志节点或名称节点所在的重启的情况下，节点将被标记为丢失并且永远不会重建。最佳答案最终问题是在DC/OS的universeHDFS包的错误版本中发现的。然而，一个全新的DC/OSHD

hadoop HDFS section dcos-community data-services mesos marathon dcos

Hadoop 文件系统 mkdirs() 在传递 777 时创建具有 755 权限的目录

下面代码段中使用的文件系统对象已通过org.apache.hadoop.fs.FileSystem.get(Configurationconf)获得。下面传递的FsPermission对象已通过FsPermission.getDefault()获得，即777。publicintmkdirs(Pathf,FsPermissionpermission){try{returnfileSystem.mkdirs(f,permission)?0:1;}catch(IOExceptione){LOG.error("Failedtoexecute'mkdirs':"+e.getMessage());

传递 Hadoop code the permission hdfs cloudera hadoop2 hortonworks-data-platform

hadoop - 在正在运行的 spark/hadoop 集群中添加一个 hdfs datanode

我有一个带有1个主节点和2个节点(工作节点+数据节点)的spark集群。我想添加另一个数据节点。问题是，当我执行hdfsdfs-setrep-R-w2时，结果是:1stdatanode->DFSUsed%:75.61%2nddatanode->DFSUsed%:66.78%3rddatanode->DFSUsed%:8.83%您知道如何平衡hdfs中的block，以便每个block大约为30->33%吗？谢谢最佳答案运行balancer，集群平衡实用程序。这将重新平衡数据节点之间的数据。hdfsbalancer-threshol

hadoop datanode section code apache-spark hdfs

windows - 无法从 IE 中找到凭据导致 HDFS WebUI Kerberos 身份验证失败

我使用kerberos身份验证设置我的HDFS服务，这就是配置:hadoop.http.filter.initializersorg.apache.hadoop.security.AuthenticationFilterInitializerhadoop.http.authentication.typekerberoshadoop.http.authentication.simple.anonymous.allowedfalsehadoop.http.authentication.signature.secret.file/opt/hadoop/hdfs/default/etc/had

凭据 Kerberos property gt lt windows hadoop authentication hdfs

linux - 在 Hortonworks Distribution 中归档 HDFS 文件时出现 AWK 使用问题

我正在尝试将HDFS目录中超过3天的文件移动到HDFS中的存档文件夹。AWK脚本:hdfsdfs-lshdfs://companycluster/data/src/purecloud/current|tail-n+2|xargs-n8|awk'{DAY_CONV=(60*60*24);X="date+%s";X|getlineED;printf("")>"X";close("X");Y="date-d\"$6\"+%s";Y|getlineSD;printf("")>"Y";close("Y");DIFF=(ED-SD)/DAY_CONV;print"SD=",SD"ED=",ED,"

时出 Distribution 2017 hdfs companycluster linux bash hadoop awk hortonworks-data-platform

hadoop - 底层目录更改时Hive表能否自动更新

如果我像这样在某个S3(或HDFS)目录之上构建一个Hive表:createexternaltablenewtable(namestring)rowformatdelimitedfieldsterminatedby','storedastextfilelocation's3a://location/subdir/';当我将文件添加到该S3位置时，Hive表不会自动更新。仅当我在该位置创建新的Hive表时才会包含新数据。有没有一种方法可以构建Hive表(可能使用分区)，以便每当将新文件添加到底层目录时，Hive表会自动显示该数据(无需重新创建Hive表)？最

底层 hadoop section stackoverflow Hive amazon-s3 hdfs

hadoop - 为什么 MapReduce 映射内存大于集群上的 block 大小？

下面是HadoopYarn中的观察结果:a)对于每个InputSplit或block，都会触发一个新的映射。b)集群的典型block大小为128MB。c)在大多数集群中，MapReduce.map.memory.mb将配置为大于1GB。事实上，Cloudera建议的block大小是128MB，而MapReduce.map.memory.mb是1GB当block大小只有128MB时，为什么我们需要分配1GB给映射内存(MapReduce.map.memory.mb)？理想情况下，最多128MB应该可以满足需要。为什么我们为map内存提供的block大小甚至超过block大小？

MapReduce hadoop section block hdfs hadoop-yarn cloudera

java - JAR 不存在或不是普通文件

在Hadoop中运行wordcount示例时，我遇到了以下错误。saying"JARdoesnotexistorisnotanormalfile:/usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduceexamples-2.2.0.jar"我的输入命令是:hadoopjar$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduceexamples-2.2.0.jarwordcountinputoutput 最佳答案只需转到该路径

java JAR hadoop section mapreduce hdfs

64 65 666768 69 70