hdfs-agent

mongodb - hadoop mongodb 连接器 - 输出数据不是 mongodb 而是 hdfs

是否可以从hadoopmongodb插件连接器读取mongodb数据，使用mapreducehadoop处理数据，当输出结果不使用hadoopmongodb插件连接器但将mapreducehadoop的结果保留在hdfs中时？最佳答案我认为之前关于SO的回答回答了你的问题，只是做了一个小改动:IsitpossibletoreadMongoDBdata,processitwithHadoop,andoutputitintoaRDBS(MySQL)?主要区别在于您会将OutputFormatClass设置为类似以下内容:job.se

hadoop - 测试与 HDFS 的连接

为了测试从Java程序到HDFS的连接，依赖FileSystem.get(configuration)是否足够或应该进行额外的完整性检查？(例如:一些基于文件的操作，如列表,复制,删除) 最佳答案 FileSystem.get(Configuration)创建一个DistrubutedFileSystem对象，该对象又依赖于DFSClient与NameNode对话。隐藏在源代码深处(1.0.2是我正在查看的版本)是为NameNode创建RPC的调用，它又为ClientProtocol接口(interface)创建代理。当这个代理被创

hadoop HDFS section protocol VersionedProtocol

hadoop - 如何使用 MAP-REDUCE java 程序将 HBASE 表加载到 HDFS

如何编写一个MAP-REDUCEjava程序来将任何表从HBASE加载到HDFS中？而不是使用下面的命令，我如何使用MAP-REDUCEjava程序编写一个TRANSFORMATION，它将从HBASE导出任何表并加载到HDFS??bin/hbaseorg.apache.hadoop.hbase.mapreduce.Driverexporthdfs://user/etc*** 最佳答案查看codeoftheExporthbase自带的函数关于hadoop-如何使用MAP-REDUCE

MAP-REDUCE hadoop code section hbase mapreduce hdfs

ubuntu - 打开 HDFS 文件夹

关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗？Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion美好的一天我对Hadoop中的以下命令有一些疑问(因为我是Linux/Ubuntu的新手):bin/hadoopdfs-copyFromLocal/tmp/folder/user/hduser/folder这会将文件从本地文件系统复制到HDFS；是否可以从Ubuntu的GUI访问HDFS？不在shell中使用“-ls”？比如，我想打开HDFS文件所在的文件夹...这可能吗？谢谢

ubuntu HDFS section stackoverflow class hadoop

hadoop - 如何在 web 上使用 php 读取/写入文件到 HDFS

如何在网络上写word，然后将内容保存到文件，然后文件写入hdfs。是用php把内容写到一个文件，然后把文件移动到hdfs文件路径？还是使用节俭？请给我一个线索。谢谢! 最佳答案尝试webhdfs，它为HDFS提供了一个REST接口(interface)。关于hadoop-如何在web上使用php读取/写入文件到HDFS，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/1100

何在 hadoop section 容保 hdfs

hadoop - 数据移动 HDFS 与并行文件系统与 MPI

我目前正致力于在MR-MPI(MPI上的MapReduce)上实现机器学习算法。我也在尝试了解其他MapReduce框架，尤其是Hadoop，所以以下是我的基本问题(我是MapReduce框架的新手，如果我的问题没有意义，我深表歉意)。问题:由于MapReduce可以在并行文件系统(GPFS)、HDFS、MPI等许多事物之上实现，等等。映射步骤之后是整理操作，然后是缩减操作。对于整理操作，我们需要跨节点进行一些数据移动。在这方面，我想知道HDFS、GPFS和MPI中的数据移动机制(节点之间)有什么区别。如果你能给我一些很好的解释，我很感激，并且可以给我一些很好的引用，这样我就可以深入了

hadoop HDFS 上实 section MapReduce filesystems

hadoop - 如何将mac连接到hadoop/hdfs集群

我有用于在集群中运行的CDH，并且我可以通过ssh访问机器。我需要将我的Mac连接到集群，所以如果我执行hadoopfs-ls，它应该会显示集群的内容。我配置了HADOOP_CONF指向集群的配置。我在我的集群中运行CDH4。我在这里遗漏了什么吗，可以连接吗？我需要做一些sshkey设置吗？最佳答案您需要确保执行此操作的一些事项:您需要将您的HADOOP_CONF_DIR环境变量设置为指向一个目录，该目录包含指向您的集群的配置XML。您的Mac应该能够直接访问构成集群的主机(所有主机)。这可以通过VPN完成，例如-如果集群不

hadoop hdfs section 中运 cloudera

java - 没有文件所有者的 S3 HDFS - AccessControlException

我目前正在运行一个用于HDFS和MapReduce的小型Hadoop集群，并且我正在尝试按照此处的页面将S3换成本地HDFS:AmazonS3forHDFS我遇到的问题是，当启动JobTracker时，如果元数据(jobtracker.info)已经存在，当Hadoop尝试访问/覆盖此文件时，它无法打开它，因为该文件的所有者确实与MapRed所有者不匹配。在hadoop-core-1.0.3(JobTracker.java)中，比较:FileStatussystemDirStatus=fs.getFileStatus(systemDir);if(!systemDirStatus.get

AccessControlException 所有者 34 code hadoop java amazon-s3 mapreduce hdfs

hadoop - hdfs 局域网ip地址主机名解析

我正在我的LAN上设置2个从站的hdfs集群。每当我给他们的IP地址。HDFS尝试从中获取主机名。它只能在ip地址而不是主机名上工作吗？是否有一个设置来告诉工作只使用ip地址而不使用主机名？最佳答案它似乎不能单独对IP地址起作用。Fortheclustertofunctioncorrectly,thepartofthestringmustbethehostname(forexamplemynamenode)nottheIPaddress.阅读更多here.也引用自here，配置dfs.datanode.dns.nameserve

局域 hadoop section blockquote the hdfs

hadoop - 通过 flume 将事件数据写入 HDFS 时出错

我正在使用cdh3update4tarball进行开发。我已经启动并运行了hadoop。现在，我还从clouderaviz1.1.0下载了等效的flumetarball，并尝试使用hdfs-sink将日志文件的尾部写入hdfs。当我运行flume代理时，它启动正常，但在尝试将新事件数据写入hdfs时以错误告终。我找不到比stackoverflow更好的小组来发布这个问题。这是我正在使用的水槽配置agent.sources=exec-sourceagent.sinks=hdfs-sinkagent.channels=ch1agent.sources.exec-source.type=ex

时出 hadoop java apache hdfs cloudera flume

149 150 151152153 154 155