草庐IT

hdfs_clusters

全部标签

java - 将数据从 MySql 导入 HDFS 的最佳方式

我想知道有什么方法可以将数据从mysql导入到HDFS,我需要说明一些条件。我知道hbase、hive和sqoop可以帮助我,但我不想要任何额外的层。只是mapreduce和hadoopjavaapi。随着mySQL中数据的更新,我还需要更新HDFS。我需要知道将mysql数据导入HDFS并实时更新的最佳方式。 最佳答案 您为什么不想使用sqoop-它可以执行您必须执行的操作(打开JDBC连接获取数据,写入hadoop)参见thispresentation来自hadoop世界09 关于j

java - hdfs movefromlocal 和 copyFromLocalFile 之间的区别

我正在使用hadoophdfs来存储大数据。我需要先将文件从本地传输到hadoop。现在我正在使用copyFromLocalFile方法,并将deleteafetcopy设置为true。请问copy和move有什么区别?哪个更高效、更安全?非常感谢,周末愉快:) 最佳答案 他们最终都调用了相同的方法,所以应该没有什么区别。这是FileSystem的代码.需要一些时间来习惯Hadoop或实际上任何软件的代码,但习惯它会更好。大多数开源框架的文档很少,因此代码是真实的最终来源。使用svn/git下载代码,在Eclipse或NetBean

java - Hadoop:如何将多维数组写入 HDFS?

我有一项任务需要将多维数组写入HDFS。由于双数组是可序列化的,我认为我可以通过使用以下代码来实现:FileSystemfs=FileSystem.get(context.getConfiguration());FSDataOutputStreamdos=fs.create(newPath(directory+"/Predictions"));ObjectWritableobj=newObjectWritable(double.class,labelPredictions);obj.write(dos);dos.close();其中directory是hdfs中的路径,labelPre

hadoop - 如何挂载安全HDFS?

为了让标准文件系统用户或程序将HDFSnamespace视为本地挂载目录,CDH4即有一个hadoop-hdfs-fuse零件。它与非安全HDFS一起工作,但在Kerberos安全HDFS上,如何在那里做?谢谢。 最佳答案 自ApacheHadoop发行版2.0.2版以来,已添加对fuse_dfs可执行文件(随Hadoop发行版提供)的Kerberos身份验证支持。我花了很多时间弄清楚应该如何配置它。我发现为了让Fuse-DFS选择正确的配置文件(包含身份验证类型、kerberos不简单等。.),CLASSPATH必须在Hadoop

hadoop - 未写入 HDFS 文件的值

我正在尝试将值写入HDFS上的文件。这是代码:FileSystemfsys=FileSystem.get(newConfiguration());StringfileName="/user/root/TestData/Parameter.txt";Pathpath=newPath(fileName);//(pathOfTestFile);//fstatus.getPath();FSDataOutputStreamfos=null;try{fos=fsys.create(path);}catch(IOExceptione1){e1.printStackTrace();}BufferedW

macos - HDFS和Hadoop 1.0.3的疑惑

我是Hadoop的新手,我一直在尝试设置我的本地机器并运行几个示例来了解该过程的工作原理。我在我的MAC上安装了hadoop1.0.3。我有一系列的问题,我会在描述我到目前为止所做的事情时问他们。我按照说明here.虽然我正在设置独立操作,但最终得到了伪分发。Q1.)有什么区别?编辑了我的.bash_profileexportHADOOP_HOME=/Library/hadoop-1.0.3exportJAVA_HOME=$(/usr/libexec/java_home)在OSX上创建到本地主机的无密码ssh。然后$sshlocalhost。然后$$HADOOP_HOME/bin/ha

hadoop - 对HDFS、HBase和Hive的一些疑惑

我对Hadoop生态系统有几个疑问。渴望很好地理解这些概念。Hive表在哪里存储数据?对于Datawarehouse,我们是否需要在Hive和Hbase表中拥有相同的数据。我们如何从Hbase插入、更新和读取数据。HDFS可以存储除csv之外的所有文件格式。我们可以在Hbase上安装PIG吗?如果我有Hive,我可以省略Hbase表吗? 最佳答案 答案,按顺序:Hive通常将数据存储在其配置的文件系统目录下的表名目录中,通常是/user/hive/warehouse的HDFS目录,可通过hive-site.xml进行调整hive.m

shell - 如何打开hdfs ://localhost:54310/user/hduser/

我尝试使用命令在hadoop中创建一个目录hadoopfs-mkdir计数那么如何在单节点集群上打开或查看hdfs://localhost:54310/user/hduser/count? 最佳答案 要查看文件夹及其内容,您可以执行如下操作:hadoopfs-lscount如果你想获取内容到你的本地文件系统,那么你可以使用gethadoopfs-getcount有关所有命令行选项的更多详细说明,请阅读here. 关于shell-如何打开hdfs://localhost:54310/use

hadoop - 通过 Cloudera Manager 4.5 安装 Hadoop 后 HDFS 仅指向本地文件系统

安装ClouderaManager4.5后,我发现它没有配置为指向正确的默认文件系统。如果我从其中一个tasktracker/datanode框运行haddopfs-ls/,我只会得到本地文件系统。但是当我在cloudera中检查core-site.xml时,我看到了这个设置,这似乎是正确的:fs.defaultFShdfs://hadoop-namenode1:8020知道我应该在这里寻找什么吗?davidparks21@hadoop-reducedslot2:~$hadoopfs-ls/Found22itemsdrwxr-xr-x-rootroot40962013-04-1213:

hadoop - 无法查看 HDFS 上的文件

我在我的HDFS上创建了一些文件。我能够执行hadoopfs-ls命令来查看它们并且工作正常。后来我无法查看它们。因此,我尝试格式化名称节点并将文件重新添加进去,它说文件已经存在。知道为什么会这样吗?如果我无法查看文件,如何删除它们?我能够在浏览器上查看文件。 最佳答案 您似乎以用户yeshwanthvenkatesh的身份登录。当您在没有路径的情况下运行hadoopfs-ls时,hadoop会向您显示您的主目录(可能是/user/yeshwanthvenkatesh)的内容,该目录似乎是空的。您可以尝试运行:hadoopfs-ls