hbase

java - 无法使用 java api 连接到 Hbase

我可以在独立模式下(没有Hadoop)使用javaapi连接到Hbase吗？这是我的代码，我想知道如何让它工作。我应该为变量“config”设置一些属性吗？我在本地安装了这些:Hbase-0.98.0Hadoop2.2.0importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.clien

java Hbase import 34 api hadoop

hadoop - Hbase - 通过列名前缀获取行的列名

我有一个具有以下描述的Hbase表。对于行键，我的列将采用a_1、a_2、a_3、b_1、c_1、C_2等形式，这是一种复合键格式。假设我的行之一是rowkey-row1columnfamily-c1columns-a_1,a_2,a_3,b_1,b_2,c_1,C_2,d_9,d_99我可以通过任何操作检索a、b、c、d作为对应于row1的列吗，我不关心a、b、c的后缀是什么...我可以获取给定行的所有列名，通过按第一部分拆分行键将它们添加到集合中并发出集合。我很担心，如果有更好的方法通过过滤器或其他一些hbase方法来完成它，请发表评论... 最佳答案

列名 hadoop section hadoopConf mapreduce hbase bigdata nosql

python - 如何使用 hbase 作为 hadoop 流作业的源

有什么方法可以使用Hbase表作为Hadoop流作业的源吗？具体来说，我想运行一个用Python编写的Hadoop流作业。当输入被指定为HDFS上的文件夹时，这很有效。但是我找不到任何关于从Hbase表中读取数据的文档。这是否受支持？或者我将不得不经历编写Java代码以首先将数据从Hbase获取到HDFS然后运行流式处理作业的考验？我使用的是Cloudera的Hbase0.94。(有一个类似的问题alreadypresenthere。但它指向第三方解决方案，没有积极贡献。我希望Hbase会支持它)。最佳答案我会使用Pig加载数据

python hadoop section noreferrer noopener hbase hadoop-streaming

java - 使用java api连接Hbase时卡住

我的本地环境:OSX10.9.2、Hbase-0.94.17、Java1.6我的Hbase模式:独立我可以在shell中进行操作，但是当我使用javaapi时，它不起作用。我的java代码:importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.client.Get;importorg.apache.hadoop.hbase.client.HTa

卡住 java hbase code 34 hadoop

hadoop - HBase 区域服务器 : error telling master we are up

我在从属RegionServer的日志中收到以下错误。问题似乎出在regionserver.HRegionServer:reportForDutytomaster=localhost,60000,1397430611631withport=60020master设置为localhost但实际上应该指向master。即使在阅读了文档之后，我也无法弄清楚奴隶是如何弄清楚主人的。完整日志为:2014-04-1404:49:35,939INFO[regionserver60020]regionserver.HRegionServer:CompactionCheckerrunsevery10se

telling hadoop RpcClient java hbase

hadoop - 加载文件时如何平衡HBase的负载？

我是Apache-Hadoop的新手。我有3个节点的Apache-Hadoop集群。我正在尝试加载一个有45亿条记录的文件，但它没有分发到所有节点。这种行为有点像区域热点。我已经从hbase-site.xml配置文件中删除了“hbase.hregion.max.filesize”参数。我观察到如果我使用4节点的集群然后它分发数据到3个节点，如果我使用3节点的集群然后它分发到2个节点。我想，我缺少一些配置。最佳答案一般来说，HBase的主要问题是准备非单调的行键。如果是，则此时仅使用一个区域服务器:http://ikaisays.

hadoop HBase section 39 apache-zookeeper

hadoop - 将数据从 HDFS 加载到 HBASE

我正在使用Apachehadoop1.1.1和Apachehbase0.94.3。我想将数据从HDFS加载到HBASE。我写了pig脚本来达到目的。首先，我在habse中创建了hbase表，然后编写了pig脚本以将数据从HDFS加载到HBASE。但它没有将数据加载到hbase表中。不知道它要去哪里。以下是用于创建hbase表的命令:创建表'mydata','mycf'下面是从hdfs加载数据到hbase的pig脚本:A=LOAD'/user/hduser/Dataparse/goodrec1.txt'USINGPigStorage(',')as(c1:int,c2:chararray,

hadoop HBASE section apache-pig bigdata

hadoop - 使用 pig 或 hive 将 CSV 数据加载到 HBase

您好，我创建了一个将数据加载到hbase中的pig脚本。我的csv文件存储在hadoop位置/hbase_tables/zip.csvpig脚本register/home/hduser/pig-0.12.0/lib/pig-0.8.0-core.jar;A=LOAD'/hbase_tables/zip.csv'USINGPigStorage(',')as(id:chararray,zip:chararray,desc1:chararray,desc2:chararray,income:chararray);STOREAINTO'hbase://mydata'USINGorg.apach

hadoop HBase java apache pig hive apache-pig hbasestorage

hadoop - Hbase 0.96 与 Mahout 0.9 集成

是否可以使用Hbase0.96版本作为Mahout0.9版本的数据源？示例:-在Hbase表上运行Mahout。我正在使用具有以下配置的系统:-Ubuntu14.04-64位架构。提前致谢。最佳答案根据您的标签，我假设您是在询问Mahout推荐系统。您可以编写代码来获取所有用户的所有项目矩阵，无论是密集矩阵还是稀疏矩阵(密集矩阵为0，其中不存在偏好强度，稀疏矩阵将忽略任何0值)这里有一些幻灯片描述了如何将Hbase与Mahout结合使用:http://www.slideshare.net/cloudera/hbasecon-20

hadoop Mahout section using-apache-hbase-for-large-matr hbase mahout-recommender hadoop-plugins

apache - 使用 apache flume 将数据流式传输到 hbase

我正在尝试使用apacheflume将数据加载到hbase中。当我使用水槽将数据流式传输到hadoop时，它工作正常。但是当我启动水槽代理将数据加载到hbase时，我得到了NoClassDefFoundError。14/05/1223:14:10INFOnode.PollingPropertiesFileConfigurationProvider:Reloadingconfigurationfile:agent4.conf14/05/1223:14:10INFOconf.FlumeConfiguration:Processing:sink114/05/1223:14:10INFOcon

apache 流式 java agent4 agent hadoop hbase bigdata flume

104 105 106107108 109 110