草庐IT

hdfs_rtp

全部标签

hadoop - 从SVN “no namenode to stop”通过Hadoop替换mapred/hdfs/common jar构建后

我从中checkout源代码http://svn.apache.org/repos/asf/hadoop/commonhttp://svn.apache.org/repos/asf/hadoop/hdfshttp://svn.apache.org/repos/asf/hadoop/mapreduce并得到hadoop-mapred-0.23.0-SNAPSHOT.jarhadoop-hdfs-0.23.0-SNAPSHOT.jarhadoop-common-0.23.0-SNAPSHOT.jar但是我无法使用这些jar启动all.sh...Jobtracker和tasktracker启

java - 在 $HADOOP_HOME 之外运行 Java 程序(使用 HDFS JAVA API)

我有一个简单的Java程序,它简单地读取和写入一些文本到HDFS上的文件。我使用hadoopHDFSReadWrite文本运行它。我想从eclipse或就像任何其他java程序一样运行它,并且仍然能够在Hadoop环境之外使用HDFS。有没有办法做到这一点?我非常需要它。 最佳答案 我能够在Eclipse中运行mapreduce作业。它与HDFS程序应该没有太大区别。从命令提示符启动名称节点和数据节点。在Eclipse中创建一个Java项目。包括常用的、hdfs和所需的jar文件。在项目中包含HDFSReadWrite.java文件

hadoop - 我们如何比较本地文件和 hdfs 文件的一致性

publicStringgetDirs()throwsIOException{fs=FileSystem.get(conf);fs.copyFromLocalFile(newPath("/private/tmp/as"),newPath("/test"));LocalFileSystemlfs=LocalFileSystem.getLocal(conf);//System.out.println(newLocalFileSystem().ge(conf.getLocalPath("/private/tmp/as")));System.out.println("LocalPath:"+l

Linux 库链接问题 - HADOOP HDFS C API

我正在尝试运行CAPI库附带的hdfs_test应用程序。当我使用命令编译应用程序时:gccmyTest.c-I/usr/HDFS/src/c++/libhdfs-L/usr/HDFS/build/c++/Linux-i386-32/lib-lhdfs-omyTest我在设置LD_LIBRARY_PATH之后这样做exportLD_LIBRARY_PATH=/usr/lib/jvm/default-java/jre/lib/i386:/usr/lib/jvm/default-java/jre/lib/i386/server:/usr/lib/jvm/default-java/jre/l

mongodb - hadoop mongodb 连接器 - 输出数据不是 mongodb 而是 hdfs

是否可以从hadoopmongodb插件连接器读取mongodb数据,使用mapreducehadoop处理数据,当输出结果不使用hadoopmongodb插件连接器但将mapreducehadoop的结果保留在hdfs中时? 最佳答案 我认为之前关于SO的回答回答了你的问题,只是做了一个小改动:IsitpossibletoreadMongoDBdata,processitwithHadoop,andoutputitintoaRDBS(MySQL)?主要区别在于您会将OutputFormatClass设置为类似以下内容:job.se

hadoop - 测试与 HDFS 的连接

为了测试从Java程序到HDFS的连接,依赖FileSystem.get(configuration)是否足够或应该进行额外的完整性检查?(例如:一些基于文件的操作,如列表,复制,删除) 最佳答案 FileSystem.get(Configuration)创建一个DistrubutedFileSystem对象,该对象又依赖于DFSClient与NameNode对话。隐藏在源代码深处(1.0.2是我正在查看的版本)是为NameNode创建RPC的调用,它又为ClientProtocol接口(interface)创建代理。当这个代理被创

hadoop - 如何使用 MAP-REDUCE java 程序将 HBASE 表加载到 HDFS

如何编写一个MAP-REDUCEjava程序来将任何表从HBASE加载到HDFS中?而不是使用下面的命令,我如何使用MAP-REDUCEjava程序编写一个TRANSFORMATION,它将从HBASE导出任何表并加载到HDFS??bin/hbaseorg.apache.hadoop.hbase.mapreduce.Driverexporthdfs://user/etc*** 最佳答案 查看codeoftheExporthbase自带的函数 关于hadoop-如何使用MAP-REDUCE

ubuntu - 打开 HDFS 文件夹

关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion美好的一天我对Hadoop中的以下命令有一些疑问(因为我是Linux/Ubuntu的新手):bin/hadoopdfs-copyFromLocal/tmp/folder/user/hduser/folder这会将文件从本地文件系统复制到HDFS;是否可以从Ubuntu的GUI访问HDFS?不在shell中使用“-ls”?比如,我想打开HDFS文件所在的文件夹...这可能吗?谢谢

hadoop - 如何在 web 上使用 php 读取/写入文件到 HDFS

如何在网络上写word,然后将内容保存到文件,然后文件写入hdfs。是用php把内容写到一个文件,然后把文件移动到hdfs文件路径?还是使用节俭?请给我一个线索。谢谢! 最佳答案 尝试webhdfs,它为HDFS提供了一个REST接口(interface)。 关于hadoop-如何在web上使用php读取/写入文件到HDFS,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/1100

hadoop - 数据移动 HDFS 与并行文件系统与 MPI

我目前正致力于在MR-MPI(MPI上的MapReduce)上实现机器学习算法。我也在尝试了解其他MapReduce框架,尤其是Hadoop,所以以下是我的基本问题(我是MapReduce框架的新手,如果我的问题没有意义,我深表歉意)。问题:由于MapReduce可以在并行文件系统(GPFS)、HDFS、MPI等许多事物之上实现,等等。映射步骤之后是整理操作,然后是缩减操作。对于整理操作,我们需要跨节点进行一些数据移动。在这方面,我想知道HDFS、GPFS和MPI中的数据移动机制(节点之间)有什么区别。如果你能给我一些很好的解释,我很感激,并且可以给我一些很好的引用,这样我就可以深入了