Hdfs

java - 将 HDFS 目录复制到本地节点

我正在处理单节点Hadoop2.4集群。我可以使用hadoopfs-copyToLocalmyDirectory复制目录及其所有内容。但是，我无法通过此java代码成功执行相同的操作:publicvoidmapObjectkey,Textvalue,Contextcontext)throwsIOException,InterruptedException{Configurationconf=newConfiguration(true);FileSystemhdfs=FileSystem.get(conf);hdfs.copyToLocalFile(false,newPath("myDi

hadoop - 在 Hadoop 中将 dfs.blocksize 设置为 100Kb

我尝试将Hadoop中的dfs.blocksize设置为100Kb，这小于默认的dfs.namenode.fs-limits.min-block-size，这是1MB。当我复制文件时hdfsdfs-Ddfs.namenode.fs-limits.min-block-size=0-Ddfs.blocksize=102400inp.txt/input/inp.txt我还是明白了，copyFromLocal:Specifiedblocksizeislessthanconfiguredminimumvalue(dfs.namenode.fs-limits.min-block-size):102

blocksize hadoop code section min-block-size properties hdfs

hadoop - Zookeer是hadoop的一部分还是单独配置？

正如我从各种tuts中读到的那样，zookeeper有助于协调和同步各种hadoop集群。目前我安装的是hadoop2.5.0。当我执行jps时，它会显示4494SecondaryNameNode8683Jps4679ResourceManager3921NameNode4174DataNode4943NodeManager动物园管理员没有进程。我怀疑zookeeper是hdfs的一部分还是我们需要手动安装？最佳答案如果你只使用hadoop，不需要zookeeper!hadoop中的其他工具，比如hbase，就看zookeepe

hadoop Zookeer section zookeeper hdfs bigdata

hadoop - 一个巨大的DataStructure可以直接交给MapReduce处理而不加载到HDFS上吗？

我们正在研究将一个巨大的N维数据结构(NetCDF文件)流式传输作为Mapper函数的输入而无需写入文本文件然后加载到HDFS上的想法。我们有一个应用程序已经拥有这个巨大的数据结构。所以我们想跳过所有涉及写入和读取文本文件的开销。我们需要对以下问题的一些输入..1)第三方应用程序能否将数据直接流式传输到MapReduce？2)如果上述情况可行，MapReduce是否会处理将此DataStructure拆分为输入block，或者我们是否需要明确地执行此操作？3)这是否可能在ApacheSPARK上实现，因为Spark从DRAM运行，而DataStructure也在DRAM上，因此我们不必

DataStructure MapReduce section noreferrer noopener hadoop hdfs apache-spark hadoop-streaming

hadoop - Flume + HDFS-200 追加

页面https://cwiki.apache.org/confluence/display/FLUME/Getting+Started说HDFSsink支持附加，但我没能找到任何关于如何启用它的信息，每个示例都在滚动文件上。因此，如果可能的话，我将不胜感激有关如何使水槽附加到现有文件的任何信息)更新可以将所有滚动属性设置为0，这将使flume写入单个文件，但它不会关闭文件并且新记录对其他进程不可见。有个题目和我的差不多:FlumeNGandHDFS，Dmitry说Flume不支持追加，但答案是一年前的，文档说的恰恰相反，所以我想也许flume得到了改进，或者我误解了什么，任何线索都将不

hadoop Flume section strong hdfs flume-ng

hadoop - 如何使用 hdfs 客户端连接到远程数据节点？

我的目标是从hdfs下载文件到本地文件系统。我正在使用连接到远程HDFSNameNode的客户端。hadoopfs-gethdfs://sourceHDFS:8020/path_to_file/file/path_to_save_file我得到了一个异常(exception)。15/03/1712:18:49WARNclient.ShortCircuitCache:ShortCircuitCache(0x11bbad83):failedtoload1073754800_BP-703742109-127.0.0.1-139845939166415/03/1712:18:49WARNhdf

hadoop hdfs section code NameNode

java - 为什么 Hadoop 无法在本地模式下找到这个文件，即使它存在？

通过maven在本地模式下运行Hadoop时出现此错误。15/03/2412:45:24INFOmapred.MapTask:Mapoutputcollectorclass=org.apache.hadoop.mapred.MapTask$MapOutputBuffer15/03/2412:45:24INFOmapred.MapTask:(EQUATOR)0kvi26214396(104857584)15/03/2412:45:24INFOmapred.MapTask:mapreduce.task.io.sort.mb:10015/03/2412:45:24INFOmapred.Map

即使 Hadoop java MapTask mapred mapreduce hdfs hadoop-yarn

hadoop - 在 [ubuntu] ubuntu : ssh: connect to host ubuntu port 22: No route to host 上启动名称节点

当我使用hdfs-dfs.sh启动Namenode时，出现错误Startingnamenodeson[ubuntu]ubuntu:ssh:连接到主机ubuntu端口22:没有到主机的路由最佳答案 1.请检查core-site.xml文件fs.default.namehdfs://192.168.203.137:9000Thenameofthedefaultfilesystem.请在Ubuntu终端中使用ipconfig命令检查您的名称节点(主节点)IPLinkencap:EthernetHWaddr00:0c:29:57:b9:d

ubuntu host strong section blockquote hadoop hdfs

hadoop - HDFS 有文件但发生 java.io.FileNotFoundException

我在Hadoop上运行MapReduce程序。输入格式将每个文件路径传递给映射器。我可以这样通过cmd查看文件，$hadoopfs-lshdfs://slave1.kdars.com:8020/user/hadoop/num_5/13.pdf找到1项-rwxrwxrwx3hdfshdfs1842692015-03-3122:50hdfs://slave1.kdars.com:8020/user/hadoop/num_5/13.pdf但是，当我尝试从映射器端打开该文件时，它不起作用。15/04/0106:13:04INFOmapreduce.Job:任务ID:attempt_142788

FileNotFoundException hadoop 射器 section FileInputStream

hadoop - 无法关闭文件，因为最后一个 block 没有足够数量的副本

从错误消息中可以明显看出，保存与文件相关的特定block的副本时出现问题。原因可能是访问数据节点以保存特定block(block的副本)时出现问题。完整日志请引用下方:我找到了另一个用户“huasanyelao”-https://stackoverflow.com/users/987275/huasanyelao也有类似的异常/问题，但用例不同。现在，我们如何解决这些问题？我了解在所有情况下都没有固定的解决方案。1.我需要立即采取什么措施来修复此类错误？2.如果有作业我当时没有监控日志。我需要采取什么方法来解决此类问题。P.S:除了修复网络或访问问题，我还应该遵循哪些其他方法。错误日志

hadoop block java apache mapreduce hdfs

38 39 404142 43 44