草庐IT

hadoop - Ganglia 无法与 Apache HBase 通信

我安装了Ganglia来监控HBase集群。我正在使用ganglia-3.3.0。Hadoop版本:hadoop-1.1.2HBase版本:hbase-0.94.8我的Hadoop集群由1个主节点和2个从节点组成。Gangliagmetad_server配置在master节点上我更改了hbase/conf/hadoop-metrics.properties文件。hbase.class=org.apache.hadoop.metrics.ganglia.GangliaContext31hbase.period=10hbase.servers=hostname_of_ganglia_ser

hadoop - 如何在hbase中使用扫描查询条件获取所有行?

我有一个hbase表,我正在使用如下所示的扫描查询表:scan'transaction',{COLUMNS=>'personaldata:NAME',FILTER=>"ValueFilter(=,'binaryprefix:ChristophBenson')"}输出看起来像:hbase(main):021:0>scan'transaction',{COLUMNS=>'personaldata:NAME',FILTER=>"ValueFilter(=,'binaryprefix:ChristophBenson')"}ROWCOLUMN+CELL2470883371column=perso

hadoop - 无法使用 Hive 版本 1.1.0 HBase 版本 0.94.8 和 hadoop 版本 2.7.0 从配置单元创建 Hbase 表

无法使用Hive版本1.1.0HBase版本0.94.8和hadoop版本2.7.0从hive创建Hbase表hive(default)>CREATETABLEtest_hive_hbase(eidint,enamestring,esaldouble)>STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'>WITHSERDEPROPERTIES>("hbase.columns.mapping"=":key,cfstr:enm,cfsal:esl")>TBLPROPERTIES("hbase.table.name"="tes

hadoop - HBase Snappy Compression - 创建表失败,CompressionTest 成功

我一直在尝试解决与SnappyCompression相关的HBase有线问题。以下是与此问题相关的所有内容的详细说明:问题描述:当我尝试在HBaseshell中创建一个带有Snappy压缩的表时:(有关Debug模式下的详细HBaseshell日志,请参见附件)hbase(main):001:0>创建't3',{NAME=>'cf1',COMPRESSION=>'SNAPPY'}SLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/local/solono/package/local_1/

java - 使用Java远程访问HBase Table List

importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.HTableDescriptor;importorg.apache.hadoop.hbase.MasterNotRunningException;importorg.apache.hadoop.hbase.client.Connection;importorg.apache.hadoop.hba

hadoop - 如何将 Hive 表映射到 HBase?

我需要将Hive表映射到HBase。我的Hive表由三列组成——namestring,degreestring,majorstring不知道怎么填空(??)CREATETABLEhbase_table(??,??,??,...)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"="??")TBLPROPERTIED("hbase.table.name"="hbase_table"); 最佳答案

java - 使用 Hadoop、Apache Spark、HBase 实现 lambda 架构

我想用一个简单的例子来实现lambda架构。我无法将我的技术堆栈融入lambda架构的每一层。我想实时找出Twitter推文中的前10个热门主题标签。我列出了来自http://lambda-architecture.net/的每一层野兔的用途.所有进入系统的数据被分派(dispatch)到批处理层以及用于处理的速度层。批处理层有两个功能:(i)管理主数据集(一组不可变的,仅附加的原始数据集),以及(ii)预先计算批处理View。服务层索引批量View,以便可以查询它们以低延迟、特别的方式。速度层补偿更新到服务层,只处理最近的数据。任何传入的查询都可以通过合并批处理的结果来回答View和

hadoop - Hbase 区域请求不平衡

我使用这个TTL来创建表:create"aos:for_test",{NAME=>"data",COMPRESSION=>"LZO"},{NUMREGIONS=>240,SPLITALGO=>"UniformSplit"}并导入一个大数据文件(近14G)到表中。即使表有240个region,客户端报错如下:Error:org.apache.hadoop.hbase.client.RetriesExhaustedWithDetailsException:Failed1822actions:RegionTooBusyException:1822times我检查了hbasewebUI,发现所

hadoop - 如何区分创建 HBase 或任何其他进程的文件或目录?

我有一个要求,我正在收集在HDFS中创建的所有文件或目录的信息,现在我想区分通过HBase创建的文件/目录.HDFS中有什么可以帮助我获取这些信息的吗?? 最佳答案 HDFS不提供HBase创建/修改的文件与其他文件之间的任何此类区别。但是,HBase将其所有数据存储到由hbase.rootdir属性指定的根目录中。它的默认值为hdfs://hbase。我认为您可以将在hdfs://hbase中创建的每个目录/文件都视为HBase文件。如有其他问题欢迎评论。 关于hadoop-如何区分创

hadoop - 用于 Hadoop 作业的 Cassandra 与 HBase

在MapReduce作业方面,Cassandra相对于HBase有哪些优势?我有很多小文件想从HDFS移动到数据库,这些文件将作为MapReduce作业的输入。我不会获取所有文件,而是针对某个用户,所以可能是整行,至少是一个列族。我可以拿走某个时期的文件。我知道HBase是Hadoop数据库,所以我希望它能很好地满足我的需求,但我还了解到Cassandra的性能要好得多。但是我想知道当你将它用作MapReduce作业的输入时是什么情况。性能是否仍然比HBase好很多?我必须强调,我不是在寻找一般的HBase和Cassandra的比较,而是在MapReduce作业的具体案例中。类似thi