草庐IT

NoSql_HBase

全部标签

hadoop - 为 HDFS 目录中的文件创建 HBase 表

我正在尝试将HDFS目录中的所有文件数据加载到HBase现有表中。您能分享我如何将所有文件数据和增量数据加载到HBase表中吗?我将HBase表创建为hbase>create'sample','cf'我要复制hdfs://ip:port/user/test进入示例hbase表。请给我建议任何解决方案。 最佳答案 答案1:(可能)ImportTSV,如果您尝试仅提供/user/hadoop/目录路径而不是完整的文件路径,它应该处理该目录中的所有文件。答案2:(好像不可能)ThespecialcolumnnameHBASE_ROW_KE

shell - 如何在HBase shell中使用describe 'table_name'创建表。

我必须在不同的集群中创建一个表,我只有hbase表的描述很方便。我如何在不同的集群中创建新的hbase表? 最佳答案 输入Hbaseshell进入hbaseshell在你的新集群的终端,然后给出命令create‘’,’’给你表名和列族名,你已经从describe'tablename'来自之前的集群。更多信息:https://www.tutorialspoint.com/hbase/hbase_create_table.htmhttps://www.tutorialspoint.com/hbase/hbase_describe_and

java - Sqoop HBase 导入 : java. lang.NoSuchMethodError : org. apache.hadoop.hbase.HTableDescriptor.addFamily

我在Ubuntu14.04上将Hadoop作为伪分布式集群运行。我也安装了HBase,一切正常。现在我想使用Sqoop的“导入”命令将数据从我本地的MySql服务器导入到HBaseHadoop版本:2.7.3HBase版本:1.2.4Sqoop版本:1.4.6(Hadoop2.0.4-alpha)Hadoop和HBase工作正常没有问题,但是运行命令./sqoopimport--connectjdbc:mysql://localhost:3306/company--tablepeople--usernamemysqluser-P--hbase-tablepeople_import--c

java - 使用 Spark 和 JAVA 从 HBase 读取数据

我想使用JAVA通过Spark访问HBase。除了this之外,我还没有找到任何例子一。答案中写着,YoucanalsowritethisinJava我从Howtoreadfromhbaseusingspark复制了这段代码:importorg.apache.hadoop.hbase.client.{HBaseAdmin,Result}importorg.apache.hadoop.hbase.{HBaseConfiguration,HTableDescriptor}importorg.apache.hadoop.hbase.mapreduce.TableInputFormatimpo

rest - 它是 Hbase REST API `get version/cluster` 中的错误吗?

HbaseRESTAPI,此接口(interface)get'version/cluster',当我使用headerAccept:application/json时,响应不是JSON而是纯文本。curl-XGET\-H"Accept:application/json"\"http://localhost:8888/version/cluster"#"1.2.2"但是当我使用Accept:text/xml时,响应是正确的XML。curl-XGET\-H"Accept:text/xml"\"http://localhost:8888/version/cluster"#1.2.2

java - SPARK 转 HBase 写入

我的SPARK程序中的流程如下:Driver-->Hbaseconnectioncreated-->BroadcasttheHbasehandle现在从执行者那里,我们获取这个句柄并尝试写入hbase在驱动程序中,我正在创建HBaseconf对象和连接对象,然后通过JavaSPARK上下文广播它,如下所示:SparkConfsparkConf=JobConfigHelper.getSparkConfig();Configurationconf=newConfiguration();UserGroupInformation.setConfiguration(conf);jsc=newJa

hadoop - HBase 到 Hive 映射表未显示完整数据

我们有一个包含1个列族的HBase表,其中有15亿条记录。使用命令检索HBase行数"count''",{CACHE=>1000000}.HBase到Hive的映射是用下面的命令完成的。createexternaltablestagingdata(rowkeyString,col1String,col2String)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES('hbase.columns.mapping'=':key,n:col1,n:col2,')TBLPROPERTIES

hadoop - 由于 HDP 2.5 中的 Solr 异常,Hbase java 代码在表创建时卡住 - SolrServers 可用于处理此请求

我正在尝试使用javaAPI将其与hbase连接。我在192.168.56.101本地运行HortonworksSandbox(HDP2.5)。以下是我的java代码importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.client.HTable;importorg.apache.hadoop.hbase.client.Put;importorg.

hadoop - hbase 跳过区域服务器直接从 hfile 读取行

我正试图将超过100亿条记录转储到hbase中,这将平均每天增长1000万,然后尝试一个完整的表扫描记录。我知道对hdfs进行全面扫描会比hbase快。Hbase用于对不同的数据进行排序在高清文件系统上。该应用程序正在使用spark构建。数据被批量加载到hbase中。由于各种2G限制,区域大小从3G的初始测试减少到1.2G(仍然需要更详细的调查)。扫描缓存为1000且缓存block关闭hbase总大小在6TB范围内,在5个区域服务器(节点)上产生数千个区域。(建议低百)。Spark作业基本上运行每一行,然后根据范围内的列计算某些内容。使用内部使用TableInputFormat的spa

hadoop - thrift 在我的 HBase master 上运行吗?如何与Happybase连接?

我正在以伪分布式模式运行krejcmat/hadoop-hbasedocker。那就是主从在同一台机器上的不同容器中运行。启动Hadoop集群和HBase后,我在主节点上启动thrift服务器:hbasethriftstart-threadpool我还公开了节点9090(以--expose=9090开头的默认Thrift端口)。我想使用Happybase库通过ThriftAPI从我的主机连接到Hadoop集群中运行的Hbase。这是我使用的命令:connection=happybase.Connection('hadoop-hbase-master',9090)但我收到错误:TTran