HBASE_CLASSPATH

hadoop - HBase 批量放置故障排除

是否可以对HBase批量放置进行故障排除？我一次使用HBase批量放置5000条记录，我想在放置失败时找出哪一行或哪几行导致问题并记录下来。最佳答案方法HTable.batch(Listactions)接收一个Puts列表并返回一个与actions列表大小相同的数组(你给函数的puts列表)。如果actions(i)失败，则result[i]将为空。请注意，当batch()中的失败是由于最大尝试写入次数时，您需要捕获RetriesExhaustedWithDetailsException，并调用getExceptions()，以

java - Hbase依赖问题: NoClassDefFoundError RegionCoprocessorHost

我正在尝试解决以下错误:13/05/0519:49:04INFOhandler.OpenRegionHandler:Openingofregion{NAME=>'-ROOT-,,0',STARTKEY=>'',ENDKEY=>'',ENCODED=>70236052,}failed,markingasFAILED_OPENinZK13/05/0519:49:04INFOregionserver.HRegionServer:Receivedrequesttoopenregion:-ROOT-,,0.7023605213/05/0519:49:04INFOregionserver.HReg

RegionCoprocessorHost NoClassDefFoundError gt lt artifactId java maven hadoop hbase cloudera

hadoop - 配置单元 hbase 集成时间戳

我想使用Hive(hivehbase集成)将表存储到HBase中我的表包含一个类型为TIMESTAMP的字段(如DATE)我做了一些研究，发现HBASE不支持TIMESTAMP，我该怎么办？Causedby:org.apache.hadoop.hive.ql.metadata.HiveException:Errorevaluatingdatatorg.apache.hadoop.hive.ql.exec.SelectOperator.processOp(SelectOperator.java:80)atorg.apache.hadoop.hive.ql.exec.Operator.pr

配置单 hadoop code apache hbase hive

java - Hbase MasterNotRunningException 尽管 Hmaster、regionserver 和 Zookeeper 已启动

我已经启动了hbase，所有守护进程都在运行。$jps8482HQuorumPeer25105RemoteMavenServer9133SecondaryNameNode11883HRegionServer13793Jps8545NameNode8572HMaster11519Main25029Main8851DataNode9435RunJar现在让我们尝试列出表格:hbase(main):004:0*listTABLEERROR:org.apache.hadoop.hbase.MasterNotRunningException:Retried7timesHereissomehelp

MasterNotRunningException regionserver zookeeper 13 INFO java hadoop hbase hdfs apache-zookeeper

hadoop - 每个 Hadoop 服务器应该有多少个 HBase 服务器？

我有一个系统可以提供较小的图像文件，这些文件存储在HBase表中，该表使用hadoop作为文件系统。我目前有2个hadoop实例和1个HBase实例，但我的问题是这里的比例应该是多少？我应该为每个hbase服务器配备1个hadoop还是真的很重要？最佳答案答案视情况而定。这取决于您拥有多少数据、regionserver的cpu利用率以及各种其他因素。您需要做一些概念证明来了解您的hadoop和hbase集群的大小。使用hadoop和hbase的多样性取决于用例。事实上，我最近看到一个hadoop和hbase集群完全解耦的设置。在

hadoop section hbase bigdata

hadoop - 一起安装 HBase + Hadoop 与分别安装 HBase 和 Hadoop 有什么优缺点？

我的意思是，2个选项:1.在Hadoop集群上安装HBase，也是做离线计算，也就是说只有1个hadoop集群。2.安装一个HadoopClusterforOfflineComputing，然后再安装一个HadoopCluster，只供HBase使用其HDFS。所以2个选项是:一个是集成集群，另一个实际上是2个集群。这两个选项的优缺点是什么？最佳答案选项1:集成集群。优点:读取或写入HBase的MapReduce作为数据局部性会更高效。缺点:HBase区域服务器会降低机器(Datanode和TaskTracker)的性能，因为它

Hadoop HBase section hdfs distributed-computing

apache - HBase master 无法启动，无法连接到 hbase.rootdir

我正在尝试根据apache网站上的设置以伪分布式模式运行HBase，但我无法正确配置hbase.root目录。这是我的配置文件的样子:在Hadoop目录中:conf/core-site.xml:fs.default.namehdfs://localhost:9000dfs.replication1mapred.job.trackerlocalhost:9001conf/hdfs-site.xml:dfs.replication1dfs.support.appendtruedfs.datanode.max.xcievers4096conf/mapred-site.xml:mapred.j

rootdir apache gt lt property hadoop amazon-ec2 localhost hbase

java - 用于修复不平衡的实时 hbase 集群的工具？

是否有任何工具/项目可用于手动修复不平衡的实时hbase集群，这些集群可以在区域服务器之间移动区域？最佳答案 HBase平衡是基于区域数量而不是区域大小，我们可以看到#region交叉每个实时RS几乎相等。Hbase从0,94开始支持pertablebalance，你可以设置“hbase.master.loadbalance.bytable”为true，master会为每张表平衡region。您可能还需要关注参数“hbase.regions.slop”，默认值为0.2此参数允许实际区域计数偏离(理想)平均区域计数此百分比。根据我的

不平 hbase section stackoverflow java hadoop

java - HBase 数据持久化

我一直在努力了解Hbase的工作原理。特别是-数据如何存储到磁盘。我在网上阅读了一些文章，其中有两篇对我有帮助——http://th30z.blogspot.com/2011/02/hbase-io-hfile.html?spref=tw和http://www.slashdocs.com/iyxmiz/hfile-a-block-indexed-file-format-to-store-sorted-key-value-pairs.html我还有一些疑问，可能是因为我对HBase不是很了解。这是我从阅读中得到的——每笔交易——(Put/Get/Delete)在memstore中保存为K

持久 HBase section block KeyValue java hadoop cloud storage

hadoop - RAMdisk 中的 HBase 速度较慢

我有一个关于将ApacheHBase与RAMdisk一起使用的一般性问题。单个表中有大量数据集合，总共约25GB。有了这些数据，我正在使用Java程序进行一些基本的聚合。因为我有足够的RAM，我尝试使用tmpfs将这个数据集放入RAMdisk:mount-ttmpfs-osize=40Gnone/home/user/ramdisk然后我停止了HBase，将data文件夹的内容复制到RAMdisk中。最后我创建了一个符号链接(symboliclink)，将旧数据目录链接到新数据目录并再次启动HBase。它有效，但是当我现在处理聚合时，它变得比以前稍微慢。如果HBase压缩数据(激活Sna

RAMdisk hadoop section HBase aggregation

110 111 112113114 115 116