草庐IT

HDFS-HAWQ

全部标签

hadoop - 向 HBase 提供文件的命令,该文件随后存储在 HDFS 中

简介对thisquestion的后续问题.HBase已经连接到HDFS。是否可以向HBase提供一个文件,该文件随后使用命令存储在HDFS中。根据thisdocumentation有几个HBaseshell命令。然而,这些命令仅限于例如创建、删除表。问题需要发出哪个命令来向HBase提供一个文件,该文件随后将存储在HDFS中? 最佳答案 问题不明确。HBase是一个键值存储。要将数据放入HBase,您必须首先创建一个具有模式的表(实际上,只是一个列族列表)。创建表后,就可以向表中加载数据;HBase命令是“put”。引用HBase书

hadoop - 我可以使用 Hadoop 插入不同的 DFS 而不是 HDFS 吗?

我正在寻找一种方法来将新文件系统挂接到Hadoop中,以针对HDFS对这个新文件系统的性能进行基准测试。我是Hadoop的新手,所以如果我问错了问题,请随时纠正我。如果有帮助,我将使用亚马逊的EMR。 最佳答案 您需要为新文件系统创建一个Hadoop文件系统驱动程序。这将是一个扩展org.apache.hadoop.fs.FileSystem的类.此类“驱动程序”的示例是众所周知的DistributedFileSystem又名。HDFS,LocalFilesystem或S3FileSystem等等。然后您必须使用core-site.

hadoop - 您可以将什么类型的数据放入 HDFS

我刚刚安装完Hadoop。我正在从互联网上下载数据样本。我可以将哪些类型的数据放入HDFS?比如我可以放Excel表格吗?谢谢 最佳答案 您可以将任何类型的数据放在HDFS上(包括Excel工作表)。但是,您可能无法阅读它们。例如,除非excel上存在HDFS连接器,否则您将无法打开集群上的文件,并且必须将它们复制回您的计算机上。如果您想从excel工作表中读取数据,最简单的方法是将每个工作表导出为csv并通过hive在HDFS上读取它们,因为有多个excel兼容的ODBC驱动程序(请参阅thisexample)。

hadoop - 如何从 hdfs 路径中剥离主机信息

我有一个hdfs路径hdfs://host1:8899/path/to/file。我想以编程方式剥离host1和端口。结果,它应该是hdfs:/path/tofile。有什么辅助方法可以做到这一点吗? 最佳答案 "Isthereanyhelpermethodcandothat?"创建您自己的并不需要太多。只需使用基本的String类实用函数,如split()、indexOf()、substring()等。像这样的事情会做(对于Java,尽管大多数语言都有这些方法):publicclassTestPath{publicstaticvo

hadoop - 是否可以使用 http 协议(protocol)从 hdfs 获取数据(而不是 hdfs ://)?

我可以使用以下uri从hdfs获取数据:hdfs://HOST:PORT/DATA_PATH。是否有将url协议(protocol)从hdfs更改为http的选项?例如:http://GOST:PORT/DATA_PATH 最佳答案 是的,您需要配置WebHDFS休息访问。参见WebHDFS–HTTPRESTAccesstoHDFS. 关于hadoop-是否可以使用http协议(protocol)从hdfs获取数据(而不是hdfs://)?,我们在StackOverflow上找到一个类似

HDFS完全分布式集群搭建与配置

HDFS完全分布式集群搭建与配置介绍HDFS前言HDFS的概念和特性整体思路准备工作配置过程三台虚拟机都已经完成的步骤hadoop-env.shyarn-env.shcore-site.xmlhdfs-site.xmlmapred-site.xmlyarn-site.xmlslaves同步配置环境变量启动集群hdfs常用命令测试注意事项介绍HDFS的组成架构架构介绍:1>NameNode(nn):就是Master,它是一个主管、管理者(1)管理HDFS的名称空间;(2)配置副本策略;(3)管理数据块(block)映射信息;(4)处理客户端读写请求2>DataNode:就是Slave。NameN

hadoop - HDFS 文件夹到键值配置单元表

我在HDFS中有以下文件夹结构:多边形文件1.kml文件2.kmlfile3.kml我想将它加载到具有以下架构的配置单元表中:表“多边形”:name|kmlfile1|contentoffile1file2|contentoffile2file3|contentoffile3如何在Hive中完成此操作? 最佳答案 据我所知,仅使用Hive是不可能的。但是您当然可以使用bash(我想它是一台Linux机器)。首先创建输入文件,例如:#!/bin/bash#thedirpathtobepassedasparameterforfilein

hadoop - 从远程服务器访问 hdfs 时,Kerberos 默认为错误的主体

我已将kerberos配置为从远程服务器访问hdfs,并且我能够进行身份验证并生成票证,但是当我尝试访问hdfs我收到一个错误:09/0215:50:02WARNipc.Client:Exceptionencounteredwhileconnectingtotheserver:java.lang.IllegalArgumentException:ServerhasinvalidKerberosprincipal:nn/hdp.stack.com@GLOBAL.STACK.COM在我们的krb5.conf文件中,我们在不同的域下定义了admin_server和kdc:DEV.STACK.

java - 如何忽略前两个字节 hdfs writeUTF 和 writeChars?

我已经在hdfs中写入了一些数据,但我希望其中没有writeUTF()方法写入的前两个字节。我想将这个前两个字节的免费hdfs文件复制到本地文件并对其进行一些分析。if(fs.exists(filenamePath)){//removethefilefirst//fs.delete(filenamePath);out=fs.append(filenamePath);}//createiffiledoesntexistselse{out=fs.create(filenamePath);}out.writeUTF(getFeaturesString(searchCriteriaList,f

hadoop - HDFS 到 Cassandra

是否可以将已处理的文件(使用PIG)从本地HDFS(比方说192.168.0.10)迁移/复制/复制/移动到cassandra(192.168.0.20)?我的想法是,我实际上创建了一个java应用程序来解析文件并将它们重新插入到cassandra中。还有其他方法吗?非常感谢! 最佳答案 写一个Java程序将Hadoop数据迁移到Cassandra表,其实是大材小用。如果您碰巧定期执行相同的操作,情况会变得更糟。相反,我们可以利用Hive的一个非常有用的功能,它可以帮助我们将Hive表与外部数据源集成。其hive的StorageHa