草庐IT

HBASE_CLASSPATH

全部标签

hadoop - 如何增加 HBase 表中的区域数

我在HBase中创建了一个表,其中预拆分了8个区域,使用HexStringSplit作为拆分算法。现在我想增加区域的数量,而不破坏现有表和其中的数据。我创建预拆分的命令是创建't1','f1',{NUMREGIONS=>15,SPLITALGO=>'HexStringSplit'}事实上,我无法再次执行此命令以增加区域数量。是否存在更新现有表中区域数量的命令? 最佳答案 请注意,您提供的命令创建了15个区域,而不是8个:create't1','f1',{NUMREGIONS=>15,SPLITALGO=>'HexStringSpli

java - HBase 设置时间戳

我在使用javaapi设置行时间戳时遇到问题。当我尝试添加时间戳值以放入构造函数(或放入put.add()中)时,没有任何反应,并且在从表中读取行后,我得到了系统提供的时间戳。publicstaticbooleanaddRecord(StringtableName,StringrowKey,Stringfamily,Stringqualifier,Objectvalue){try{HTabletable=newHTable(conf,tableName);Putput=newPut(Bytes.toBytes(rowKey),12345678l);put.add(Bytes.toByt

hadoop - 在 Amazon EMR 上使用来自 java 的 hbase 时遇到问题

因此,我尝试使用作为MapReduce步骤启动的自定义jar在Amazonec2上查询我的hbase集群。我是我的jar(在map函数内),我这样调用Hbase:publicvoidmap(Textkey,BytesWritablevalue,Contextcontex)throwsIOException,InterruptedException{Configurationconf=HBaseConfiguration.create();HTabletable=newHTable(conf,"tablename");...问题是,当它到达该HTable行并尝试连接到hbase时,该步骤

hadoop - HDFS、HBase、Pig、Hive 和 Azkaban 之间的关系?

我对Apache有点陌生Hadoop.我看过this和this关于Hadoop、HBase、Pig、Hive和HDFS的问题。他们都描述了上述技术之间的比较。但是,我已经看到,通常一个Hadoop环境包含所有这些组件(HDFS、HBase、Pig、Hive、阿兹卡类)。有人能以架构工作流的方式解释这些组件/技术与它们在Hadoop环境中的职责之间的关系吗?最好有一个例子? 最佳答案 总体概述:HDFS是Hadoop的分布式文件系统。直观上,您可以将其视为跨越许多服务器的文件系统。HBASE是一个面向列的数据存储。它以Google的B

hadoop - HBase HDFS 动物园管理员

现在我正在学习HBase。我像这样设置我的HBase集群和Hadoop集群:server1:NamenodeHMasterserver2:datanode1RegionServer1HQuorumPeerServer3:datanode2RegionServer2HQuorumPeerServer4:datanode3RegionServer3HQuorumPeer我有几个关于HBase集群的问题:1:AllRegionServersmustbeintheHadoopClustersoitcanuseHDFStostoredata,eventhoughitwillstoredatain

hadoop - HBase:创建与现有表具有相同架构的表

我尝试在论坛上搜索,在那里我可以从现有的hbase表架构创建一个新的空hbase表,但找不到。更准确地说,假设我有一个包含多个列族和这些列族中的许多列限定符的表。现在我必须创建另一个具有相同架构的空表。我们是否可以像在RDBMS中那样创建表。Createtablenew_tableasselect*fromexisting_tablewhere1=2;现有表具有复杂的结构,因此无法使用指定列族和列限定符的普通hbasecreatetable命令。仅供引用..我正在使用MaprHBase0.98.12-mapr-1506,我没有切换到任何高级版本或其他发行版的选项。

来自 HBase 的 Hadoop mapreduce 流

我正在构建一个使用HBase(0.20.1)作为数据源和数据接收器的Hadoop(0.20.1)mapreduce作业。我想用Python编写作业,这要求我使用hadoop-0.20.1-streaming.jar将数据流式传输到Python脚本或从中流式传输数据。如果数据源/接收器是HDFS文件,这很好用。Hadoop是否支持从/到HBase的流式传输以进行mapreduce? 最佳答案 这似乎可以满足我的要求,但它不是Hadoop发行版的一部分。仍然欢迎任何其他建议或意见。http://github.com/wanpark/ha

hadoop - 使用主机系统上的客户端访问在 VM 中运行的 HBase

我尝试用客户端程序将一些数据写入hbaseHBase@Hadoop在Cloudera@ubuntu的预配置虚拟机中运行。客户端在托管虚拟机的系统上运行,并直接在虚拟机中运行客户端。所以现在我想用vm外的client访问vm上的server我正在使用NAT。为了能够访问HBaseMaster、HUE等服务器,在虚拟机上运行我在虚拟框中配置了端口转发:因此我可以访问HBaseMaster、HUE的概览站点。在我创建的虚拟机上针对服务器运行客户端hbase-site.xml内容:hbase.zookeeper.quorumlocalhosthbase.zookeeper.property.c

hadoop - Hbase 管理的 zookeeper 突然尝试连接到本地主机而不是 zookeeper quorum

我正在使用表映射器和缩减器对大规模问题进行一些测试。在某一点之后,当工作完成80%时,我的reducer开始出现故障。从我查看系统日志时可以看出,问题是我的一个动物园管理员试图连接到本地主机,而不是法定人数中的其他动物园管理员奇怪的是,当映射正在进行时,它似乎可以很好地连接到其他节点,这减少了它遇到的问题。以下是系统日志的选定部分,可能与弄清楚发生了什么有关2014-06-2709:44:01,599INFO[main]org.apache.zookeeper.ZooKeeper:Initiatingclientconnection,connectString=hdev02:5181,

hadoop - HBase中的邻接表结构

我正在尝试在中实现以下图缩减算法该图是无向加权图我想去掉所有只有两个邻居的节点并更新权重请看下图:Algorithmreducegraphhttp://public.kungi.org/graph-reduction.png算法会将上图转换为下图。剔除节点2,更新边的权重为:w(1-3)=w(1-2)+w(2-3)因为我有一个非常大的图,所以我用MapReduce来做这件事。我的问题是如何在HBase中表示图形。我想像这样在HBase中构建一个邻接表结构:列族:节点、邻居1->2,6,7...有更好的方法吗? 最佳答案 邻接表是最常