hbase-unsecure

hadoop - 1 个大 Hadoop 和 Hbase 集群 vs 1 个 Hadoop 集群 + 1 个 Hbase 集群

Hadoop会跑很多jobs，从Hbase读取数据，写数据到数据库。假设我有100个节点，那么有两种方法可以构建我的Hadoop/Hbase集群:100节点hadoop&hbase集群(1个bigHadoop&Hbase)分离数据库(Hbase)，那么我们有两个集群:60节点Hadoop集群和40节点Hbase集群(1个Hadoop+1个Hbase)哪个选项更好？为什么？谢谢。最佳答案我会说选项2更好。我的推理-尽管您的要求主要是运行大量mapreduce作业以从hbase读取和写入数据，但有很多hbase的幕后工作，以优化您提

java - 无法使用 Java 连接到 Hbase

您好，我已经在我的机器上安装了ubuntu并安装了hbase0.98-hadoop2。然后我编辑了hbase-env.sh文件和hbase-site.xml。现在我的hbaseshell工作正常。但是当我尝试使用hbasejavaapi从Java代码连接到hbase时。我收到错误。我的代码是:Configurationhc=HBaseConfiguration.create();HTableDescriptorht=newHTableDescriptor("User");ht.addFamily(newHColumnDescriptor("Id"));ht.addFamily(newH

Hbase java section hadoop

java - 如何从 HBase 结果中读取字符串？

我正在使用HBaseMapReduce(docs)从HBase表中读取字符串。以下是部分代码:publicvoidmap(ImmutableBytesWritablerow,Resultvalues,Contextcontext)throwsIOException{Stringtesting=values.getValue(Bytes.toBytes("data"),Bytes.toBytes("lastLine")).toString();try{context.write(newImmutableBytesWritable(Bytes.toBytes(testing)),newIn

HBase java 1415868730030 timestamp 00 hadoop

hadoop - 能否将CDH3的HBase数据导出，导入CDH5的HBase？

我们有一个旧的基于CDH3的集群，我们将数据存储在该集群上的HBase中。我们还有全新的集群，其中安装了CDH5.2。我们想将HBase数据从CDH3集群迁移到CDH5集群。我想知道是否可以跨不同版本迁移数据？是否像使用distcp命令一样直接？在迁移数据之前和迁移过程中我需要采取哪些预防措施？最佳答案我认为对此没有简单的解决方案。我能想到的最简单的解决方案是使用一个MapReduce作业将每个HBase表导出到CDH3集群上的HDFS。一个DistCp作业将导出的HDFS数据从您的CDH3集群传输到CDH5集群上的HDFS，最

HBase CDH section hadoop cloudera-cdh

hadoop - 在 HBase 中使用月份作为列族

我正在尝试设计一个用于在HBase中存储时间序列数据的表。由于一个月内写入的所有数据都将“一次全部”读取以进行分析，我想知道使用月份(作为字符串，如“201501”)作为列族是否是一个好的选择选择。我的应用程序将在数据到达时使用时间戳保存数据，然后在月底，将使用hadoop作业分析与该月相关的所有数据。根据规范，列族中的所有数据将存储在一起。就(1)设计和(2)性能而言，这是一个好的做法吗？我不确定，因为这是一种远离关系世界的选择。最佳答案一般来说，HBase中有很多列族会影响性能。我认为使用HBase时不建议使用超过2个或3个

hadoop HBase section code XXX-YYY

hadoop - hbase和hive有什么区别？ (Hadoop)

据我理解，Hbase是Hadoop数据库，Hive是数据仓库。Hive允许创建表并在其中存储数据，您还可以将现有的HBase表映射到Hive并对其进行操作。如果hive做所有这些，为什么我们应该使用hbase？我们可以单独使用配置单元吗？我很困惑:( 最佳答案因此，简单来说，使用Hive，您可以在表上触发类似SQL的查询(有一些异常(exception))，并用于批处理操作。而使用hbase，您可以进行实时查询，并且基于键值对。“如果hive做所有这些，为什么我们应该使用hbase？我们可以单独使用hive吗”因为Hive不支持更

hadoop section Hive hbase bigdata nosql

hadoop - Pig,Hive,Hbase,Oozie,Zookeeper在Hadoop 2.0和Hadoop 1.0的安装是一样的吗？

我最近使用YARN配置安装了hadoopv_2。我计划安装Hadoop生态系统堆栈，如Pig、Hive、Hbase、Oozie、Zookeeper等。我想知道我是否应该从我为Hadoop1.0配置所做的相同链接安装这些工具。如果没有，谁能给我发送这些工具的Hadoop2配置链接？。我听说Pig和Hive在Hadoop2.0中更快。所以想知道有没有更好的版本。谢谢，高瑟姆最佳答案 http://www.cloudera.com/content/cloudera/en/documentation/cdh4/v4-2-1/CDH4-In

Hadoop Zookeeper section cloudera hive hbase apache-pig oozie

rest - 来自 org.apache.hadoop.hbase.client.HConnectionManager.createConnection 的 InvocationTargetException 异常

由于上述错误，我基于tomcat的RESTAPI应用程序无法处理请求。到目前为止，我已经尝试过以下事情:检查所有的jar文件是否可用检查tomcat/webapp/目录中所有文件的权限防火墙规则Hbase是否可用但随后也出现以下异常。我正在使用包含HBase0.98.6的CDH5.3.1。有谁知道如何解决这个问题？2015-03-0305:09:02privateLog[ERROR]java.lang.reflect.InvocationTargetExceptionorg.apache.hadoop.hbase.client.HConnectionManager.createConn

InvocationTargetException HConnectionManager java springframework org rest tomcat hadoop hbase

hadoop - 错误消息 : "offset (0) + length (4) exceed the capacity of the array: 2" while fetching data from HBase

由于上述错误，我基于tomcat的RESTAPI应用程序无法处理请求。我在尝试从HBase检索数据时遇到错误。我使用RESTFul网络服务作为我的界面。我正在使用包含HBase0.98.6的CDH5.3.1。有谁知道如何解决这个问题？在此处输入代码错误详情:错误信息:“偏移量(0)+长度(4)超出数组的容量:2” 最佳答案也许您需要更改一些架构类型规范？我得到这个错误，除了offset(0)+length(4)exceedthecapacityofthearray:1。这是因为缺少相关列的值，我假设1个字节表示空值。在Java中使

amp the section code stackoverflow hadoop hbase

hadoop - Phoenix View 未正确读取 HBase 数值

我的HBase表有包含bigint的列。那些从Hive声明的bigints，我使用Hive来generateallHBase'sHFilesforbulkloading.我可以从HBaseshell打印该行并查看适当的整数值:...00000020-079e-4e9f-800b-e71937a78b5dcolumn=cf:p_le_id,timestamp=1428571993408,value=1395243843...我从Phoenix中选择该行并看到一个负值。select"p_le_id"from"bulk_1month"whereUUID='00000020-079e-4e9f

Phoenix hadoop section HBase code apache-phoenix

109 110 111112113 114 115