hbase-unsecure

java - 写入 HDFS 或 Hbase 的内容是否立即对 Hadoop 集群中的所有其他节点可见？

当Hadoop作业正在运行或正在进行时，如果我向HDFS或Hbase写入一些内容，那么数据对集群中的所有节点可见1.)立即？2.)如果不是立即那么多长时间后？3.)或者时间真的无法确定？最佳答案 HDFS具有强一致性，因此一旦成功完成写入，新数据应该立即在所有节点上可见。显然，实际的写作需要一些时间-请参阅replicationpipelining有关这方面的一些详细信息。这与最终一致的系统形成对比，最终一致的系统在所有节点看到数据的一致View之前可能需要不确定的时间(尽管通常只有几毫秒)。Cassandra等系统具有可调一致性

Hadoop Hbase section 有节长时 java hive

hadoop - CDH4 Hbase 使用 Pig ERROR 2998 java.lang.NoClassDefFoundError : org/apache/hadoop/hbase/filter/Filter

我在伪分布式模式下使用CDH4，我在同时使用HBase和Pig时遇到了一些问题(但两者都可以单独工作)。我正在逐步遵循这个不错的教程:http://blog.whitepages.com/2011/10/27/hbase-storage-and-pig/所以我的Pig脚本看起来像这样register/usr/lib/zookeeper/zookeeper-3.4.3-cdh4.1.2.jarregister/usr/lib/hbase/hbase-0.92.1-cdh4.1.2-security.jarregister/usr/lib/hbase/lib/guava-11.0.2.ja

hadoop NoClassDefFoundError java apache LogicalPlanGenerator hbase apache-pig cloudera

hadoop - 如何增加 HBase 表中的区域数

我在HBase中创建了一个表，其中预拆分了8个区域，使用HexStringSplit作为拆分算法。现在我想增加区域的数量，而不破坏现有表和其中的数据。我创建预拆分的命令是创建't1','f1',{NUMREGIONS=>15,SPLITALGO=>'HexStringSplit'}事实上，我无法再次执行此命令以增加区域数量。是否存在更新现有表中区域数量的命令？最佳答案请注意，您提供的命令创建了15个区域，而不是8个:create't1','f1',{NUMREGIONS=>15,SPLITALGO=>'HexStringSpli

hadoop HBase section split code

java - HBase 设置时间戳

我在使用javaapi设置行时间戳时遇到问题。当我尝试添加时间戳值以放入构造函数(或放入put.add()中)时，没有任何反应，并且在从表中读取行后，我得到了系统提供的时间戳。publicstaticbooleanaddRecord(StringtableName,StringrowKey,Stringfamily,Stringqualifier,Objectvalue){try{HTabletable=newHTable(conf,tableName);Putput=newPut(Bytes.toBytes(rowKey),12345678l);put.add(Bytes.toByt

HBase java section code toBytes api hadoop

hadoop - 在 Amazon EMR 上使用来自 java 的 hbase 时遇到问题

因此，我尝试使用作为MapReduce步骤启动的自定义jar在Amazonec2上查询我的hbase集群。我是我的jar(在map函数内)，我这样调用Hbase:publicvoidmap(Textkey,BytesWritablevalue,Contextcontex)throwsIOException,InterruptedException{Configurationconf=HBaseConfiguration.create();HTabletable=newHTable(conf,"tablename");...问题是，当它到达该HTable行并尝试连接到hbase时，该步骤

hadoop Amazon hbase zookeeper amazon-web-services apache-zookeeper elastic-map-reduce

hadoop - HDFS、HBase、Pig、Hive 和 Azkaban 之间的关系？

我对Apache有点陌生Hadoop.我看过this和this关于Hadoop、HBase、Pig、Hive和HDFS的问题。他们都描述了上述技术之间的比较。但是，我已经看到，通常一个Hadoop环境包含所有这些组件(HDFS、HBase、Pig、Hive、阿兹卡类)。有人能以架构工作流的方式解释这些组件/技术与它们在Hadoop环境中的职责之间的关系吗？最好有一个例子？最佳答案总体概述:HDFS是Hadoop的分布式文件系统。直观上，您可以将其视为跨越许多服务器的文件系统。HBASE是一个面向列的数据存储。它以Google的B

Azkaban hadoop strong section hive hbase hdfs

hadoop - HBase HDFS 动物园管理员

现在我正在学习HBase。我像这样设置我的HBase集群和Hadoop集群:server1:NamenodeHMasterserver2:datanode1RegionServer1HQuorumPeerServer3:datanode2RegionServer2HQuorumPeerServer4:datanode3RegionServer3HQuorumPeer我有几个关于HBase集群的问题:1:AllRegionServersmustbeintheHadoopClustersoitcanuseHDFStostoredata,eventhoughitwillstoredatain

动物 hadoop strong HBase RegionServer apache-zookeeper

hadoop - HBase:创建与现有表具有相同架构的表

我尝试在论坛上搜索，在那里我可以从现有的hbase表架构创建一个新的空hbase表，但找不到。更准确地说，假设我有一个包含多个列族和这些列族中的许多列限定符的表。现在我必须创建另一个具有相同架构的空表。我们是否可以像在RDBMS中那样创建表。Createtablenew_tableasselect*fromexisting_tablewhere1=2;现有表具有复杂的结构，因此无法使用指定列族和列限定符的普通hbasecreatetable命令。仅供引用..我正在使用MaprHBase0.98.12-mapr-1506，我没有切换到任何高级版本或其他发行版的选项。

hadoop HBase 39 gt code mapr hbase-shell

来自 HBase 的 Hadoop mapreduce 流

我正在构建一个使用HBase(0.20.1)作为数据源和数据接收器的Hadoop(0.20.1)mapreduce作业。我想用Python编写作业，这要求我使用hadoop-0.20.1-streaming.jar将数据流式传输到Python脚本或从中流式传输数据。如果数据源/接收器是HDFS文件，这很好用。Hadoop是否支持从/到HBase的流式传输以进行mapreduce？最佳答案这似乎可以满足我的要求，但它不是Hadoop发行版的一部分。仍然欢迎任何其他建议或意见。http://github.com/wanpark/ha

mapreduce Hadoop section 流式 hbase

hadoop - 使用主机系统上的客户端访问在 VM 中运行的 HBase

我尝试用客户端程序将一些数据写入hbaseHBase@Hadoop在Cloudera@ubuntu的预配置虚拟机中运行。客户端在托管虚拟机的系统上运行，并直接在虚拟机中运行客户端。所以现在我想用vm外的client访问vm上的server我正在使用NAT。为了能够访问HBaseMaster、HUE等服务器，在虚拟机上运行我在虚拟框中配置了端口转发:因此我可以访问HBaseMaster、HUE的概览站点。在我创建的虚拟机上针对服务器运行客户端hbase-site.xml内容:hbase.zookeeper.quorumlocalhosthbase.zookeeper.property.c

中运 hadoop ClientCnxn zookeeper property hbase virtualbox cloudera

142 143 144145146 147 148