hdfs_clusters_草庐IT

java - 尝试执行 hdfs zkfc 命令时弹出错误

大家好，我是hadoop的新手，想试试这个功能，谁能帮帮我。你们谁能帮忙。我在单节点集群上运行。$hdfszkfcExceptioninthread"main"org.apache.hadoop.HadoopIllegalArgumentException:HAisnotenabledforthisnamenode.atorg.apache.hadoop.hdfs.tools.DFSZKFailoverController.setConf(DFSZKFailoverController.java:122)atorg.apache.hadoop.util.ToolRunner.run(T

map - 在没有 Hdfs 的情况下运行 jar 文件 map reduce

我已经从我的eclipse项目中捆绑了一个jar。我想将参数传递给jar。基本上是jar的输入文件。我想知道如何提供不在Hdfs中的输入文件。我知道那不是现在hadoop的作品，但这是为了测试目的。Eclipse具有本地文件的功能。有没有办法通过命令行来做到这一点？最佳答案您可以通过从命令行覆盖作业跟踪器和文件系统属性，以“本地”模式运行hadoop:hadoopjar-fslocal-jtlocal您需要使用GenricOptionsParser(如果您使用ToolRunner来启动您的工作，这是常态。

map reduce section hadoop apache

scala - 使用scala将文件复制到hadoop hdfs？

我正在尝试将本地计算机上的文件复制到我的hdfs。但是，我不确定如何在Scala中执行此操作，因为我正在编写的脚本当前写入本地CSV文件。如何使用scala将此文件移动到HDFS？编辑:我现在做了什么:valhiveServer=newHiveJDBCvalfile=newFile(TMP_DIR,fileName)valfirstRow=getFirstRow(tableName,hiveServer)valrestData=getRestData(tableName,hiveServer)withPrintWriter(file){printWriter=>printWriter.

scala hadoop section write printWriter hdfs

hadoop - HDFS 和 MapReduce 如何处理小文件

我已经在Windows平台上安装了Hadoop和2个其他工作节点(我总共有3个节点)。出于演示目的，我正在处理大约1兆字节的单个文件。工作节点如何划分此文件以进行处理。不同的工作节点每个会处理341(1024/3)KB。或者单个工作节点将处理该文件。如果我处理100个这样的文件。工作节点会分配要处理的文件数量吗？如果我处理一个大约100MB的文件。最佳答案可能的答案，Howworkernodeswoulddividethisfileforprocessing.Woulddifferentworkernodeswouldproce

MapReduce 何处 the block blockquote hadoop hdfs

hadoop - 如何将文件放在目录名称中有空格的 hdfs 目录中？

我正在尝试将一个文件放在HDFS目录中，目录名称包含空格。出现以下问题:假设hdfs目录“subdir1”已经存在。现在我尝试使用以下命令在此目录中放置一个文件sub.txt:hadoopfs-putsub.txt/user/jdutt/TempTesting/output//sub\dir1/它不会将文件放在“subdir1”目录中；相反，它会创建另一个名为“sub%20dir1”的目录并将文件放在那里。如何解决这个问题？最佳答案请用%20替换空格，它可能会解决您的问题。关于ha

目录名有空 section sub hadoop hdfs

hadoop - 如何从ftp服务器导入csv文件到hadoop(HDFS/HIVE/HBASE)？

我的源文件以csv格式位于ftp服务器中。我想将这些文件导入HDFS进行进一步处理。我不知道如何获取这些csv文件。谁能帮我解决这个问题？最佳答案您可以将此过程分为两步并将文件上传到hdfs。第一步:从ftp服务器下载文件并存储在本地。这应该有所帮助:TransferfilesfromFTPservertolocalunixserver第2步:在本地拥有文件后，您可以使用hadoopfs-put将文件传输到hdfs。例子。如果你的文件名是temp.csv你可以这样做:hadoopfs-puttemp.csv$hadoop_pat

hadoop HBASE section stackoverflow hive

java - Hadoop mapReduce 如何在 HDFS 中只存储值

我正在使用它来删除重复行publicclassDLines{publicstaticclassTokenCounterMapperextendsMapper{privatefinalstaticIntWritableone=newIntWritable(1);privateTextword=newText();@Overridepublicvoidmap(Objectkey,Textvalue,Contextcontext)throwsIOException,InterruptedException{Stringline=value.toString();//inthash_code=

储值何在 IntWritable section Text java hadoop mapreduce

hadoop - distcp hdfs 到 s3 失败

我试图做一个目录，其中有数百个os小文件，扩展名为.avro但对于某些文件失败并出现以下错误:14/09/1813:05:19INFOmapred.JobClient:map99%reduce0%14/09/1813:05:22INFOmapred.JobClient:map100%reduce0%14/09/1813:05:24INFOmapred.JobClient:TaskId:attempt_201408291204_35665_m_000000_0,Status:FAILEDjava.io.IOException:Copied:32Skipped:0Failed:1atorg

hadoop distcp mapred JobClient INFO amazon-s3 hdfs

python - 如何从hdfs读取文件

这个问题在这里已经有了答案:PythonreadfileasstreamfromHDFS(4个答案)关闭5年前。我在/project1目录下的hadoop文件系统中有一个名为mr.txt的文本文件。我需要编写python代码来读取文本文件的第一行，而无需将mr.txt文件下载到本地。但是我无法从hdfs打开mr.txt文件。我试过:open('hdfs:///project1/mr.txt','r')

python hdfs section notice span hadoop

bash - 计算 HDFS 文件夹中具有给定扩展名的文件数

我正在编写一个bash脚本，它应该能够计算指定文件夹中的json文件的数量。我现在正在做的是:hdfsdfs-ls/path/to/files/*.json|grep-E'^-'|wc-l当至少有一个文件时，它返回结果的数量，但是当没有json文件时，我希望结果为0，因为路径存在但不包含任何匹配的文件*.json模式。然而，我得到的是一个错误:ls:`/path/to/files/*.json':Nosuchfileordirectory这是预期的行为吗？最佳答案是的，这是默认行为。由于这些是错误消息，因此它们被发送到stder

给定扩展名 section code questions bash hadoop hdfs