Hdfs

java - Spark `FileAlreadyExistsException` when `saveAsTextFile` 即使输出目录不存在

这个问题在这里已经有了答案:Howtooverwritetheoutputdirectoryinspark(9个回答)关闭6年前。我正在运行这个命令行:hadoopfs-rm-r/tmp/output然后是一个带有main()的Java8spark作业SparkConfsparkConf=newSparkConf();JavaSparkContextsc=newJavaSparkContext(sparkConf);JavaRDDrdd=sc.textFile("/tmp/input").map(s->newJSONObject(s))rdd.saveAsTextFile("/tmp/

hadoop - 如何通过grafana(opentsdb)监控dfs.namenode.handler.count？

像这样？picture我的问题是是否也有像RedMashine中那样的指标。它的名字是什么？或者我是否应该定义一个指标？这该怎么做？谢谢! 最佳答案 Grafana2.5的Opentsdb查询编辑器默认启用建议。因此，当您开始键入任何指标的名称或什至尝试将光标放在文本框中时，您将看到指标名称的建议。如果您使用的是Grafana2.5之前的旧版本。那么您将必须在提到的Opentsdb中启用某些属性here在文档中。关于hadoop-如何通过grafana(opentsdb)监控dfs.n

opentsdb namenode section noreferrer noopener hadoop hdfs hadoop2 grafana

hadoop - hdfs 数据已损坏。无法删除损坏的文件夹，因为它显示没有这样的文件或目录

我的hdfs数据损坏了。在执行fsck时，我得到了以下结果./siva:损坏blockblk_-1910702044505537827/siva:损坏blockblk_6483992593913191763/siva:缺少2个总大小为82009995的blockB.Status:损坏总尺寸:82009995B目录总数:8文件总数:1区block总数(已验证):2(平均区block大小41004997B)损坏文件:1缺失的方block:2缺失尺码:82009995B损坏block:2最少复制block:0(0.0%)过度复制block:0(0.0%)复制不足的block:0(0.0%)错

hadoop hdfs block section siva

hadoop - datanode在hdfs下没有 "namenode"目录

所以我有一个小型Hadoop集群，其中有1个主服务器和5个工作服务器。我的masters和workers的hdfs-site.xml看起来像这样:dfs.replication3dfs.namenode.name.dirfile:/home/username/hadoop/yarn/hdfs/namenodedfs.datanode.data.dirfile:/home/username/hadoop/yarn/hdfs/datanode我的集群运行平稳，所有守护进程运行良好。我能够访问HDFS以导入、导出数据、运行字数统计作业等......但是在我的工作人员中，“/home/user

amp datanode section gt lt hadoop hadoop-yarn

java - hdfs dfs -ls 的默认值

为什么hdfsdfs-ls与hdfsdfs-ls/不同。hdfsdfs-ls的默认值是多少最佳答案默认是您的hdfs用户的主目录，类似于/user/$USER(其中$USER是您在shell中登录的用户，与hdfs无关)。关于java-hdfsdfs-ls的默认值，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/36184034/

java hdfs section code hadoop

hadoop - 如何将Hadoop文件系统保存在hadoop安装盘以外的物理盘中？

我正在尝试在多节点集群环境中安装hadoop。我已经在SSD上安装了ubuntu15.10。我想在SSD上安装hadoop2.6.2，并将我的HDFS放在单独的SATA硬盘上。为此，我应该遵循哪些步骤？我在SSD中安装了hadoop，在hdfs-site.xml中配置如下。因此，我将属性dfs.datanode.data.dir设置为file:///media/coea23/HDFS/hdfs/datanode。但是在执行jps时数据节点没有显示，而名称节点显示在已完成hadoop安装的SSD中。dfs.datanode.data.dirfile:///media/coea23/HDF

hadoop strong section dfs hdfs

hadoop - 从 Spark 作业创建 FS 的快照

我想在运行spark作业时创建底层HDFS的快照。特定步骤涉及删除某些Parquet文件的内容。我想创建快照执行删除操作，验证操作结果并继续执行后续步骤。但是，我找不到从我的spark作业访问HDFSAPI的好方法。我要创建快照的目录在HDFS中被标记/标记为可快照。创建快照的命令行方法有效，但是我需要以编程方式执行此操作。我在CDH5.5上运行Spark1.5。关于如何执行此操作的任何提示线索？谢谢内存开发最佳答案我还没有验证这一点，但至少我没有遇到编译错误，理论上这个解决方案应该有效。这是Scala代码:valsc=newS

hadoop Spark section stackoverflow snapshotPath apache-spark hdfs java

Hadoop IO 错误 : Type mismatch in key from map : expected org. apache.hadoop.io.Text，收到 RegexMatcher.CustomKey

我收到以下错误:java.lang.Exception:java.io.IOException:Typemismatchinkeyfrommap:expectedorg.apache.hadoop.io.Text,receivedRegexMatcher.CustomKeyatorg.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)atorg.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:522)Caused

RegexMatcher CustomKey Text class apache hadoop mapreduce hdfs

hadoop - 使用 WebHDFS 复制文件

有没有一种方法可以将文件从(比方说)hdfs://old复制到hdfs://new而无需先下载文件然后再上传又是？最佳答案不知道WebHDFS，但这可以使用hadoopdistcp实现.该命令看起来像这样:hadoopdistcphdfs://old_nn:8020/old/location/path.filehdfs://new_nn:8020/new/location/path.file 关于hadoop-使用WebHDFS复制文件，我们在StackOverflow上找到一个类似

WebHDFS hadoop section code hdfs

shell - 在 oozie 工作流 (HUE) 中，如何将参数从 shell 操作传递到 HDFS fs 操作

在我的工作流程中，我有一个shell操作和一个HDFSfs操作ShellAction与日期相呼应。(日期=2016-10-06)我想在HDFSfsactionmkdir路径中设置上面的日期参数。以下是Action定义。我收到以下错误。EL_ERROREncountered"&",expectedoneof[,,,"true","false","null","(",")","-","not","!","empty",] 最佳答案您需要连接两个字符串以形成完整路径。Stringconcat(Strings1,Strings2)它返回2

shell 传递 34 section code hadoop hdfs oozie hue

34 35 363738 39 40