hdfs-master_草庐IT

hadoop - 无法删除 HDFS 损坏的文件

我无法删除我的HDFS中存在的损坏文件。Namenode已进入安全模式。区block总数为980，其中978已报告。当我运行以下命令时，sudo-uhdfshdfsdfsadmin-report生成的报告是，SafemodeisONConfiguredCapacity:58531520512(54.51GB)PresentCapacity:35774078976(33.32GB)DFSRemaining:32374509568(30.15GB)DFSUsed:3399569408(3.17GB)DFSUsed%:9.50%Underreplicatedblocks:0Blockswit

hadoop - 如果添加到 zookeeper 的 master 之一关闭，则事件 master 不接受新申请

我在spark独立集群中启用高可用性(HA)时遇到了一个非常奇怪的问题。我已经配置了3个sparkmaster，并按照以下步骤在zookeeper中注册了它们:创建配置文件ha.conf，内容如下:spark.deploy.recoveryMode=ZOOKEEPERspark.deploy.zookeeper.url=ZK_HOST:2181spark.deploy.zookeeper.dir=/spark通过将此属性文件作为参数传递给start-master脚本来启动所有3个主控器，如下所示:./start-master.sh-hlocalhost-p17077--webui-po

一关 master spark scala apache hadoop apache-spark bigdata apache-zookeeper high-availability

Hadoop 2.9.0 - hadoop namenode -format 和 hdfs-site.xml dfs.namenode.name.dir

我的第一个问题，我会尽量不把事情搞砸:)出于学习目的，我正在4节点集群上安装Hadoop2.9.0。我已经按照官方ApacheHadoop2.9.0文档和一些谷歌页面开始安装/配置名称节点。我像这样编辑了位于$HADOOP_HOME/etc/hadoop目录下的hdfs-site.xml:dfs.namenode.name.dirfile:///apps/hdfs/namenode/datadfs.datanode.data.dirfile:///apps/hdfs/datanode/datadfs.namenode.checkpoint.dirfile:///apps/hdfs/na

namenode hdfs-site hadoop section gt hdfs

hadoop - 当目录存在时 hdfs moveFromLocal 中的奇怪行为

我正在尝试使用moveFromLocalhdfsshell命令将文件(树结构)从本地文件系统移动到hdfs。如果目标子目录不存在，一切正常。但是，如果它们存在(这是一般情况——因为文件被添加到现有目录)，则会创建层次结构中的另一个级别例子:磁盘上的原始结构$findsrcsrcsrc/asrc/a/2src/a/2/file1src/a/1src/a/1/file1src/a/4src/a/4/file1src/a/3src/a/3/file1src/bsrc/b/2src/b/2/file1src/b/1src/b/1/file1src/b/4src/b/4/file1src/b/3

moveFromLocal hadoop supergroup 2014 root hdfs

java - 使用 java 将 hdfs 文件复制到另一个 hdfs 位置

我需要使用Java将hdfs文件复制到hdfs中的另一个位置。不应删除源，只是想在目标hdfs位置复制具有新文件名的源文件。我只能在FileSystem.java类中看到copyFromLocal、copyToLocal或重命名。谁能告诉我是否有任何方法可以将新名称的hdfs文件复制到源目录中？最佳答案使用FileUtil类的copy函数:来自javadoc(http://hadoop.apache.org/docs/stable/api/org/apache/hadoop/fs/FileUtil.html):publicsta

java hdfs section strong hadoop

rhdfs - RJavaTools 将数据集写入 hdfs 时出错

我在hadoop的hortonworks沙箱版本上运行rStudioServer。我加载了rhdfs包，但是当我尝试使用hdfs.put()命令将数据集写入hdfs时，我收到以下错误:hdfs.put(mtcars,"/user/root")Errorin.jcall("RJavaTools","Ljava/lang/Object;","invokeMethod",cl,:java.io.IOException:Filec(21,21,22.8,21.4,18.7,18.1,14.3,24.4,22.8,19.2,17.8,16.4,17.3,15.2,10.4,10.4,14.7,3

时出 RJavaTools section hdfs 34 r hadoop rjava

hadoop - LZO-就地在 HDFS 上压缩和索引文件？

通常我会执行以下操作来使用LZO:使用lzop命令将数据文件压缩到本地磁盘。放入HDFS。使用分布式lzo索引器生成.index文件。我想知道有没有办法同时对HDFS上的原始文件进行压缩和索引？最佳答案是的，你可以:在客户端和服务器上的core-site.xml中，将com.hadoop.compression.lzo.LzopCodec添加到以逗号分隔的编解码器列表中:io.compression.codecsorg.apache.hadoop.io.compress.DefaultCodec,org.apache.hadoo

就地 hadoop gt lt property lzo

apache - Hbase Master 和 Region 服务器无法启动

Hadoop在分布式模式下成功运行。在分布式模式下启动HBase时出现以下错误。尝试了hbase-site.xml配置中的所有内容。不知道如何处理这个问题？014-03-1013:55:42,493INFOorg.apache.zookeeper.ClientCnxn:Openingsocketconnectiontoserverip-112-11-1-111.ec2.internal/112.11.1.111:2181.WillnotattempttoauthenticateusingSASL(Unabletolocatealoginconfiguration)2014-03-101

apache Master zookeeper java hadoop hbase cluster-computing apache-zookeeper

java - 如何处理 master actor 故障

我是Akka的新手，我构建了一个连接到HDFS的Akka模型，提取数据，对其进行处理并将处理后的数据写回HDFS。现在，如果我的masteractor崩溃了，那么相应的子actor(Workers)也会崩溃，整个系统必须重新启动。因此，如果有一个创建辅助主控的进程，一旦主主控发生故障且恢复时间最短，它会自动开始运行。我无法围绕这个画出清晰的画面。我们将不胜感激。谢谢最佳答案来自docs:/user:TheGuardianActorTheactorwhichisprobablymostinteractedwithisthepare

何处 master section guardian actor java hadoop akka

hadoop - 在 RDD 方法中访问 HDFS 输入拆分路径

我的HDFS文件路径包含我想在Spark中访问的元数据，即类似以下内容的内容:sc.newAPIHadoopFile("hdfs://.../*"),...).map(rdd=>/*accesshdfspathhere*/)在Hadoop中，我可以通过FileSplit.getPath()访问整个拆分的路径。我可以在Spark中做任何类似的事情吗，或者我是否必须将路径字符串附加到扩展NewHadoopRDD中的每个RDD元素，我认为这可能相当昂贵？最佳答案在您提供给map()方法的闭包中，没有可用的元数据/执行上下文信息。你可能

hadoop HDFS section code the apache-spark