草庐IT

hdfs_clusters

全部标签

hadoop - HDFS安全模式问题

我遇到了HDFS问题。错误如下:Problemaccessing/nn_browsedfscontent.jsp.Reason:Cannotissuedelegationtoken.Namenodeisinsafemode.Thereportedblocks428needsadditional2blockstoreachthethreshold0.9990oftotalblocks430.Safemodewillbeturnedoffautomatically.我什至尝试使用命令离开安全模式。但是我遇到了super用户权限问题,即使我以root用户身份尝试也是如此。我正在使用CDH4。

java - Pig UDF 将文件写入 HDFS

我想通过PigUDF读取一个完整的文件,然后使用Java中的PrintWriter库准备一个输出文件并将其存储在HDFS上。这可能吗,遵循的步骤1)我能够读取UDF中的输入文件。从该文件准备一个HashMap。[已实现]2)通过过滤输入文件将数据写入输出文件。使用HashMap完成过滤[YETTOBEACHIEVED]任何人都可以在我的步骤2中提供帮助。目的是在PigUDF中创建一个文件并写入该文件。谢谢,问候,DheerajRampally。 最佳答案 没问题...我已经找到了替代方案...我现在不再写入文件,而是从PigUDF返

hadoop - HDFS是如何下载文件的?

如果Hadoop复制设置为3并且我使用hadoopdfs-get下载文件,有多少数据节点同时向我传输数据?下载方式是类似RAID的并行方式,还是依次一个一个读取datanode? 最佳答案 只从一个节点顺序读取数据。请注意,文件可能是多个block,在这种情况下,block是从不同的节点拉取的。 关于hadoop-HDFS是如何下载文件的?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questi

hadoop - 有什么办法可以在 Windows 环境中从虚拟机的 hdfs 系统打开文件?

也许我的问题有点愚蠢,但我想在主机Windows环境中访问hdfs文件,特别是在eclipse中。Hadoop和所有相关的东西都安装在VirtualBox上(使用HortonworksSandbox环境。使用CentosOS)。在虚拟机上,我可以毫无问题地使用hdfs,尝试访问hdfs://192.168.56.101:8020/user/root/vectors/dictionary.file-0。尝试在eclipse上访问它,但出现异常。那么,有什么办法吗?如果可能的话,最好能得到一个例子。 最佳答案 问题的主要原因是系统不知道

hadoop - hdfs 会保留 CSV 文件的列标题吗?

我有一个带有列标题的巨大csv文件。我的问题是,当我将csv文件放入HDFS时,集群中的所有文件会保留header还是会少header。 最佳答案 如果您只是使用命令行或API将文件复制到HDFS,那么是的,文件不会以任何方式更改(标题将保留)。但如果您打算将其用作配置单元表,那么您需要在加载文件之前删除header,然后创建适当的配置单元表。 关于hadoop-hdfs会保留CSV文件的列标题吗?,我们在StackOverflow上找到一个类似的问题: ht

java - Hadoop HDFS PutMerge 不起作用

我尝试在我的计算机上运行PutMergeinHadoopinAction。但它不起作用。我在本地机器上创建了几个文件以下是代码packageorg.apache.hadoop.examples;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FSDataInputStream;importorg.apache.hadoop.fs.FSDataOutputStream;importorg.apache.hadoop.fs.FileStatus;i

hadoop - Apache Shark 0.9.1 无法连接到 HDFS?

在Shark中,当我运行时:CREATEEXTERNALTABLEtest(memberIdSTRING,categorySTRING,messageSTRING,sourceSTRING,event_typeSTRING,log_levelSTRING,pathSTRING,hostSTRING,event_timestampSTRING,eventFieldsMAP)PARTITIONEDBY(datePartSTRING)ROWFORMATSERDE'com.company.eventserde.EventSerde'LOCATION'/user/ubuntu/test';我得到

hadoop - HDFS 中的最大文件名大小

我对hdfs中文件名的最大大小和hdfs中文件路径的最大大小(文件结构可以嵌套多深)有疑问。我已经编写了一个Map-Reduce作业,我正在为Reducer在输出中生成的文件生成自定义名称。所以只需要知道文件名的最大大小和目录结构的最大深度,这样我就可以确保在我的代码中不超过最大可能的大小。提前致谢。 最佳答案 这取决于操作系统下的文件系统。例子:对于extFS(目前Linux上使用最多的):maxfilenamelength:255bytesmaxpathlength:noneFS不知道扩展名,它有255个字节,包括扩展名(你可以

file - HDFS 文件何时可见

假设默认的Hadoop设置,如果我将一个128MB大小的文件写入HDFS。客户端需要将2个block写入HDFS。所以我的问题是第一个block写入HDFS后文件是否可供其他人读取,还是必须等待第二个block也写入?第二种情况,文件大小为64MB,2.有人可以读取当前写入HDFS的block吗?或者有人必须等待写入完成。 最佳答案 HDFS以block的形式思考。因此,如果您的文件由2个block组成,并且您的一个block已写入,您可以读取该block。但是,由于它只是文件的一个block而不是整个文件,您必须在dfs.data

hadoop - Flume-ng hdfs 安全

我是hadoop和FlumeNG的新手,我需要一些帮助。我不明白hdfs安全性是如何实现的。以下是Flume用户指南中的配置行:#hdfs-Cluster1-sink的属性agent_foo.sinks.hdfs-Cluster1-sink.type=hdfsagent_foo.sinks.hdfs-Cluster1-sink.hdfs.path=hdfs://namenode/flume/webdata这是否意味着任何知道我的hdfs路径的人都可以向我的hdfs写入任何数据? 最佳答案 这个问题是很久以前的,但我会尝试为任何其他处