hdfs

mysql - 使用 sqoop(1.4.5) 将 mysql 数据导入到 hdfs(hadoop 2.4.1)

我是Hadoop的初学者，试图使用sqoop1.4.5从我的本地数据库mysql导入一个表到hadoop2.4.1的hdfs。mysqlversion:5.5.38hdfsversion:hadoop2.4.1sqoopversion:1.4.5我尝试了sqoop-list-databases，它给出了正确的答案但随后给出以下命令:sqoopimport--connectjdbc:mysql://localhost:3306/information_schema--usernameroot--passwordroot--tableVIEWs-m1我得到:ERRORtool.Import

hadoop - 我们能否将我们的 HDFS 数据或 Map Reduce 输出显示为 HTML 表单或 JSP 页面？

是否可以将我们的HDFS数据或MapReduce输出显示为HTML表单或JSP页面？如果是，那么如何？最佳答案在web服务和J2EE项目的帮助下，使用Hadoop文件系统api(引用here)来cathdfs文件，您可以在网页中显示结果。但是，请记住您正在处理的数据大小，巨大的数据(TB和PB)也会影响您的网络应用内存。关于hadoop-我们能否将我们的HDFS数据或MapReduce输出显示为HTML表单或JSP页面？，我们在StackOverflow上找到一个类似的问题：

hadoop Reduce section strong hdfs

Hadoop - HDFS Namenode 元数据 - FSImage

我知道在主节点中我们有名称节点，它在两个文件中维护一个元数据。一个是FSImage，另一个是Editlogs。所以这个FSImage最初是在hadoop系统启动时加载的，这个FSImage包含了集群的目录结构和存储的数据。然后，对于发生的每个事务，都会更新编辑日志文件。我的问题如下:这些只是包含所有信息(FSImage和EditLogs)的文件还是还有更多？这是否意味着FSImage文件只会被写入一次？如果是，那为什么它总是被复制到二级名称节点？这不是增加了一个待完成的任务吗？假设我在hdfs中添加或删除了一个新文件；那么这个FSImage不会被更新吗？最

Namenode FSImage section li hadoop metadata hdfs

hadoop - 将多个文件通过管道传输到 HDFS

我正在尝试将gzip文件从远程计算机上的目录加载到本地计算机的HDFS上。我希望能够从远程机器读取gzip文件并将它们直接通过管道传输到我本地机器上的HDFS中。这是我在本地机器上得到的:sshremote-host"cd/files/wanted;tar-cf-*.gz"|tar-xf-|hadoopfs-put-"/files/hadoop"这显然将所有gzip文件从指定的远程路径复制到我执行命令的路径，并将一个空文件-加载到HDFS中。如果我在不使用tar的情况下尝试，也会发生同样的事情:sshremote-host"cd/files/wanted;cat*.gz"|hadoop

hadoop HDFS code section pipe

java - Hadoop 上的错误 : Could not find or load main class org. apache.hadoop.hdfs.tools.GetConf

Error:Couldnotfindorloadmainclassorg.apache.hadoop.hdfs.tools.GetConf在[]上启动名称节点localhost:启动namenode，记录到/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-ingreens-namenode-ingreens-desktop.outlocalhost:启动datanode，记录到/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-ingreens-datanode-ingreens-desktop.out错误:无法找到

GetConf Hadoop HADOOP_HOME java apache

hadoop - 谁访问了 Hive 表或 HDFS 目录

有没有办法找出哪个用户对Hive表运行了“选择”查询？什么时间运行的？更一般地说，哪个用户访问了HDFS目录？最佳答案 HDFS有一个审计日志，它会告诉你哪些操作是由哪些用户运行的。这是olddoc这显示了如何启用审计日志记录，但应该仍然是相关的。不过，对于Hive级别的审计日志记录，您必须了解一些前沿技术。Hortonworks收购了XASecure以在其平台上实现安全级别功能。Cloudera收购Gazzang也是为了做同样的事情。他们对Hive和HBase等其他服务具有一定程度的审计日志记录(和授权)。他们还添加了更多与安全

hadoop Hive section 上实 hdfs hiveql

hadoop - 从属机器上的数据节点已打开，但命令 "hdfs hdfsadmin -report"会引发错误？

hduser@master-virtual-machine:/usr/local/hadoop/etc/hadoop$jps5934日元3490二级名称节点3678资源管理器5108名称节点hduser@master-virtual-machine:/usr/local/hadoop/etc/hadoop$hdfsdfsadmin-report15/02/2822:35:03警告util.NativeCodeLoader:无法为您的平台加载nativehadoop库...在适用的情况下使用内置java类配置容量:0(0B)当前容量:0(0B)DFS剩余:0(0B)使用的DFS:0(0B

从属 amp section hadoop master-virtual-machine

java - 从 HDFS 读取属性文件

我正在尝试像这样读取HDFS上的Java属性文件:try{properties.load(newFileInputStream("hdfs://user/hdfs/my_props.properties"));}catch(IOExceptione){thrownewRuntimeException("Propertiesfilenotfound.");}但它似乎不起作用，我得到“找不到属性文件”。异常(exception)。如果我将路径替换为本地文件，它工作正常并且我能够读取该文件。是否可以使用FileInputStream读取HDFS文件？谢谢! 最佳答

java HDFS section FileInputStream stackoverflow hadoop microsoft-distributed-file-system distributed-filesystem

Hadoop 将本地文件复制到 HDFS？

我正在尝试将名为“afile”的本地文件复制到HDFS。所以我运行了以下命令:'hadoopfs-copyFromLocal/home/neo/afilein'或'hadoopfs-put/home/neo/afilein'然而，它说:'文件/home/neo/afile不存在'然后我将文件'afile'放入hadoop下的目录中。现在copyFromLocal成功了。但是，文件“in”是空的，因为我运行'hadoopfs-ls'，它显示'-rw-r--r--'1neosupergroup02015-04-0617:45/user/neo/in我也试过“hadoopfs-catin”，

Hadoop HDFS code section

hadoop - 我应该在集群的所有数据节点上运行 `hdfs namenode -format` 吗？

我正在设置Hadoop集群。据我了解，至少有两名worker的集群的最低设置是4台机器:名称节点资源经理数据节点1数据节点2我对hdfsnamenode-format命令感到困惑，看起来它只用于格式化名称节点，但它的描述(当运行一个空的hdfs命令时)声明“格式化DFS文件系统”。这是否意味着我也应该在所有数据节点上作为安装的一部分运行该命令，还是应该只在名称节点上运行？最佳答案您只需格式化一次。它告诉NameNode做一个格式化，这主要是一个元数据操作。您不一定需要在NameNode实际驻留的节点上执行此操作。应该可以从任何地

namenode hadoop section code li

208 209 210211212 213 214