草庐IT

HBASE_CLASSPATH

全部标签

azure - 使用 ImportTsv 在 Azure 的 HBase 中加载文件时出错

尝试使用推荐的方法在MicrosoftAzure云中的HDInsight中运行的HBase中加载tsv文件,通过远程桌面连接并在命令行上运行尝试将t1.tsv文件(具有两个制表符分隔的列)从hdfs加载到hbaset1table:C:\apps\dist\hbase-0.98.0.2.1.5.0-2057-hadoop2\bin>hbaseorg.apache.hadoop.hbase.mapreduce.ImportTsv-Dimporttsv.columns=HBASE_ROW_KEY,numt1t1.tsv并得到:错误:除了行键和时间戳(可选)之外,还需要一列或多列用法:impo

hadoop - Hive 显示的行数少于 HBase

我在HBase数据源上创建了一个Hive表,并将数据(CSV文件)从S3导入到该表中。这是在AWSEMR上运行的。我已经用几行验证了这一点,没问题。但是,当我导入一个合理的数据集(1000万行)时,我发现Hive给我的计数与HBase给我的计数不一致。如果我在HBase中进行计数,我会得到1000万的结果。如果我在Hive中进行计数,我得到的结果是9,932,183。我已经编写了一个查询来暴力比较导入的数据与源S3数据,但是即使在中等规模的集群上执行也需要大量时间。与此同时,寻找可能导致这种差异的可能性和想法。我应该指出,我会把自己归类为这个部门的菜鸟。 最

sql - 像普通 sql 一样查询 hbase

我知道Hbase不像普通的SQL。但是有可能像这样查询Hbase吗?selectrow-keyfromTablewherecf:first="ram"andcf:middle="leela"andcf:last="ban";//ram(firstname)leela(middlename)ban(lastname) 最佳答案 有两种方法:使用ApachePhoenix(推荐)。它是HBase的强大SQL包装器。使用ApacheHive。Hive可以使用HiveQL创建“外部表”:CREATEEXTERNALTABLEemployee

hadoop - hbase - 是否有任何 "explain"关键字?

我正在HBase中搜索“explain”关键字。(类似于impala中的explain关键字http://www.cloudera.com/content/cloudera/en/documentation/core/latest/topics/impala_hbase.html)谢谢! 最佳答案 没有解释,因为您可以动态添加列(灵活模式)。但我们有describe命令,因此您将获得带有系列的描述表(不是列) 关于hadoop-hbase-是否有任何"explain"关键字?,我们在St

hadoop - Brew Hadoop Hbase 安装旧版本

如果我安装Hadoop和Hbase:brewinstallhadoophbase我得到以下版本:hadoop:2.6.0hbase:0.98.8但需要版本:hadoop:1.1.2hbase:0.94.8如何通过Brew安装旧版本? 最佳答案 如果您已经使用brew安装了hadoop和hbase,请使用以下方法取消链接:brewunlinkhadoopbrewunlinkhbase现在尝试使用versions子命令搜索特定版本的hadoop和hbase:$brewversionshadoop|grep1.1.21.1.2gitche

java - MapReduce HBase 空指针异常

我是大数据的初学者。首先,我想尝试mapreduce如何与hbase一起工作。该场景是基于作为主键的日期对我的hbase使用mapreduce中的字段uas求和。这是我的table:Hbase::Table-testROWCOLUMN+CELL10102010#1column=cf:nama,timestamp=1418267197429,value=jonru10102010#1column=cf:quiz,timestamp=1418267197429,value=\x00\x00\x00d10102010#1column=cf:uas,timestamp=141826719742

hadoop - HBase-0.98.8-hadoop2 中的 Hive-0.14.0 集成问题

我有hive0.14.1hbase0.98.8和hadoop2.5.0我正在尝试将hive与hbase集成并从HBase中放入zookeeper-3.4.6.jar,hbase-common-0.98.8-hadoop2.jar文件/lib到Hive/lib。遵循的步骤如下:1.hive--auxpath$HIVE_HOME/lib/hive-hbase-handler-0.14.1.jar,$HIVE_HOME/lib/hbase-common-0.98.8-hadoop2.jar,$HIVE_HOME/lib/zookeeper-3.4.6.jar,$HIVE_HOME/lib/g

hadoop - Pig Hive Hbase 之间有何不同

我是hadoop技术的新手。我想弄清楚这些PigHive和Hbase用于哪种类型的数据(结构化、非结构化、semo结构化)?在哪种情况下使用哪种工具最有效? 最佳答案 您应该从阅读最基本的Hadoop文档开始:http://hadoop.apache.org/#What+Is+Apache+Hadoop%3F然后,您可以在每个项目站点上找到最佳解释:ApachePig是一个用于分析大型数据集的平台,由用于表达数据分析程序的高级语言以及用于评估这些程序的基础架构组成。Pig程序的显着特性是它们的结构适合大量并行化,这反过来又使它们能够

hadoop - 如何将 Double[] 插入到 HBase 中?

例如,如果我想插入一个double[]之类的,双[]dArr={10.23,25.1,30.5,45.3};到HBase表中。你能告诉我如何将它插入到hbase中吗?? 最佳答案 你可以存储任何你想要的东西,你只需要将它序列化为一个字节[]:Double[]dArr={10.23,25.1,30.5,45.3};byte[]value=newbyte[0];byte[]family="f".getBytes();byte[]column="d".getBytes();for(Doubled:dArr){value=Bytes.add

java - 错误 : java. lang.ClassNotFoundException : org. apache.hadoop.hbase.HBaseConfiguration 使用 javac 编译

我是Hadoop和MapReduce的初学者。在我的UbuntuVM上安装Hadoop后,我尝试了一些入门示例,例如Wordcount和Anagram。我想在MapReduce上做一个Apriori。我在Sourceforge(http://sourceforge.net/p/apriorimapred/wiki/Home/)上找到了这个。在我下载并安装了一些必需的组件之后,例如HBase和Log4j(尽管我在安装log4j时遇到问题所以我选择通过将级别设置为关闭来禁用它们),我正在努力解决这个问题"Error:java.lang.ClassNotFoundException:org.