HDFS_DATANODE_草庐IT

hadoop - 无法正常启动hadoop datanode

我正在尝试安装hadoop2.2.0，但在启动dataenode服务时出现以下错误，请帮助我解决此问题。在此先致谢。2014-03-1108:48:16,406信息org.apache.hadoop.hdfs.server.common.Storage:锁定/home/prassanna/usr/local/hadoop/yarn_data/hdfs/datanode/in_use.lock由nodename3627@prassanna-Studio-1558获取2014-03-1108:48:16,426致命org.apache.hadoop.hdfs.server.datanode

hadoop - 为什么 Map 任务输出写入到本地磁盘而不是 HDFS？

我正在准备考试，这是讲义中的一个问题:WhyMaptasksoutputsarewrittentothelocaldiskandnottoHDFS?这是我的想法:减少网络流量的使用，因为reducer可能与输出在同一台机器上运行，因此不需要复制。不需要HDFS的容错能力。如果作业中途终止，我们总是可以重新运行maptask。还有哪些可能的原因？我的回答合理吗？最佳答案你的推理是正确的。但是我想补充几点:如果map输出写入hdfs会怎么样。现在，写入hdfs不像写入本地磁盘。这是一个更复杂的过程，namenode确保至少将dfs.

hadoop HDFS section code mapreduce

hadoop - HDFS LeaseExpiredException

我有一个应用程序，它应该将大量文件从S3等源复制到HDFS。该应用程序在内部使用apachedistcp，并通过流式传输将每个单独的文件从源复制到HDFS。每个单独的文件大约1GB，有1K列字符串。当我选择复制所有列时，写入失败并出现以下错误:-2014-05-2023:57:35,939WARNorg.apache.hadoop.hdfs.DFSClient:ErrorRecoveryforblocknullbaddatanode[0]nodes==null2014-05-2023:57:35,939WARNorg.apache.hadoop.hdfs.DFSClient:Could

LeaseExpiredException hadoop apache java distcp

hadoop - 解压 Hadoop hdfs 目录中的所有 Gzip 文件

在我的HDFS上，我有一堆gzip文件，我想将其解压缩为正常格式。是否有用于执行此操作的API？或者我如何编写一个函数来执行此操作？我不想使用任何命令行工具；相反，我想通过编写Java代码来完成这项任务。最佳答案你需要一个CompressionCodec解压缩文件。gzip的实现是GzipCodec.你得到一个CompressedInputStream通过编解码器并使用简单的IO输出结果。像这样:假设你有一个文件file.gz//pathoffileStringuri="/uri/to/file.gz";Configuratio

hadoop code section codec gzip compression

Hadoop:在 HDFS 中连接 CSV 文件的工具？

我有几个结构相同的巨大CSV文件存储在HDFS中。是否有任何工具可以将这些文件连接成一个CSV文件？最佳答案 hadoopfs-catmyfiles/*.csv|hadoopfs-put-myfiles_together.csv这会连接文件内容，然后通过put将其传回HDFS。那里的-表示使用标准in作为文件内容，而不是一些本地文件。这比下拉然后向上推要好，因为它不使用磁盘。所以，您可能会说“嘿!那是不可扩展的!”好吧，不幸的是，没有可扩展的方法来在HDFS中写出一个大文件。您必须在单个线程中按顺序写入该单个文件。我的基本论点是，

Hadoop HDFS section code

hadoop - 可以只安装 Hadoop HDFS 吗？

我是Hadoop世界的新手，我需要安装带有HadoopHDFS的mesos来制作容错的分布式文件系统，但所有安装引用都包括我的场景所需的组件，例如:MapReduce。您对此有任何想法或引用吗？最佳答案绝对有可能。不要把Hadoop看成是一个可安装的程序，它只是由一堆运行在集群内不同节点上的java进程组成的。如果你使用hadooptarball，如果你只需要HDFS，你可以只运行NameNode和DataNodes进程。如果您使用其他hadoop发行版(例如HDP)，我认为HDFS和mapreduce来自不同的rpm包，但安装

hadoop section HDFS mapreduce mesos mesosphere

hadoop - 如何在终端中编辑 HDFS 中的 txt 文件？

有没有办法直接通过终端修改HDFS里面的txt文件？假设，我有“my_text_file.txt”，我想使用以下命令在HDFS中修改它。$hdfsdfs-XXXXuser/my_text_file.txt我很想知道“xxxx”是否存在。请注意，我不想在本地进行修改，然后将其复制到HDFS。最佳答案您不能编辑已经在HDFS中的文件。它不会支持。HDFS致力于“一次写入，多次读取”。因此，如果您想编辑文件，请在本地副本中进行更改，然后将其移动到HDFS。关于hadoop-如何在终端中编

何在 hadoop section HDFS 中进

hadoop - HDFS如何计算可用 block ？

假设block大小为128MB，集群有10GB(所以大约80个可用block)。假设我创建了10个小文件，总共占用128MB的磁盘空间(block文件、校验和、复制...)和10个HDFSblock。如果我想再添加一个小文件到HDFS，那么HDFS是用什么来计算可用block的，是使用的block还是实际的磁盘使用量？80个block-10个block=70个可用block或(10GB-128MB)/128MB=79个可用block？谢谢。最佳答案 block大小只是指示HDFS如何在集群中拆分和分发文件-HDFS中没有物理保留的

hadoop block section HDFS

hadoop - UnregisteredNodeException导致slave上的dataNode启动失败

我有一个由两台机器组成的Hadoop2.5集群，在从属机器上，数据节点因UnregisteredNodeException而失败。这是主配置:master$jps5036Jps7145DataNode918ResourceManager7338SecondaryNameNode6986NameNode1105NodeManager对于奴隶slave$jps15950Jps26650NodeManager这是来自hadoop-hadoop-datanode-slave.log的完整堆栈跟踪:2014-10-2319:43:46,895WARNorg.apache.hadoop.hdfs.

UnregisteredNodeException dataNode hadoop apache java cluster-computing hdfs hadoop-yarn hadoop2

ruby - 如何使用 Ruby 在 Hadoop HDFS 中写入和读取文件？

有没有一种方法可以使用Ruby来处理HDFSApi？据我所知，没有多语言文件Api，唯一的方法是使用nativeJavaApi。我尝试使用JRuby，但此解决方案不稳定且不是很原生。我还查看了HDFSThriftApi，但它并不完整，也缺少许多功能(比如写入索引文件)。除了使用JRuby或ThriftApi之外，还有其他方法可以使用Ruby处理HDFS吗？最佳答案 github中有两个项目符合您的要求。ruby-hdfs为Ruby提供到HDFS的nativeC绑定(bind)。ganapati与Thrift服务器接口(interf

Hadoop ruby section noreferrer hdfs api