草庐IT

HBASE_CLASSPATH

全部标签

hadoop - 如何使用 Rest API 手动触发 HBase 平衡器命令?

从HBaseshell可以使用balancer命令触发平衡器。有没有办法使用提供的RESTAPI来做到这一点? 最佳答案 您无法通过RESTAPI启动HBaseshell命令balancer。 关于hadoop-如何使用RestAPI手动触发HBase平衡器命令?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/55060834/

hadoop - 重新部署后 HBase 协处理器未更新

我正在使用HBase1.1.2,并尝试重新部署自定义端点协处理器以修复我的Java代码中的错误。我对协处理器代码做了一些更改,并通过以下步骤重新部署了它:重建协处理器jar将其复制到HDFS上的某个位置删除现有的协处理器:alter'table',METHOD=>'table_att_unset',NAME=>'coprocessor$1'通过HBaseUI确认该表没有附加协处理器通过禁用表并运行alter'table',METHOD=>'table_att','coprocessor'=>'hdfs:///user/bwatson/sum-coprocessor-0.1.0添加新的协

java.lang.Exception : java. io.IOException:设置 hadoop 和 hbase 时值类错误

我是Hadoop和Hbase的新手,我正在尝试让它们协同工作。我构建了一个.java并获得了一个.jar存档,没有任何错误。无论如何,在启动程序时出现此错误:java.lang.Exception:java.io.IOException:wrongvalueclass:classorg.apache.hadoop.hbase.client.Putisnotclassorg.apache.hadoop.io.IntWritableatorg.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)a

java - SIMPLE 身份验证未启用。可用 :[TOKEN, KERBEROS] -Hbase Master 无法激活

我正在尝试设置一个具有3个节点的HBase集群。我已经尝试配置SecureHbase一周了,但我仍然遇到错误:ERROR[Thread-15]master.HMaster:Failedtobecomeactivemasterorg.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException):SIMPLEauthenticationisnotenabled.Available:[TOKEN,KERBEROS]我正在运行Hbase2.0.5和Hadoop3.1.2。Secureha

hadoop - Hbase 0.20.6 无法启动master异常

我在上使用Hbase0.20.6和Hadoop0.21.0>Ubuntu10.04LTS并且出现无法启动主错误。(错误附加在hbase-root-master-ubuntu.log文件的帖子末尾)Hbase0.20.6可以与Hadoop0.21.0一起正常工作吗??如果不是,是否有变通办法??问题根源是什么??感谢您的时间和考虑。日志:java.io.IOException:Calltolocalhost/127.0.0.1:54310failedonlocalexception:java.io.EOFExceptionatorg.apache.hadoop.ipc.Client.wr

hadoop - HBase NoServerForRegionException?

我有一段时间没有与HBase通信时出现此异常:org.apache.hadoop.hbase.client.NoServerForRegionException:尝试定位根区域超时,因为:连接被拒绝这是否与session过期有关,如果是,我该如何延长session生命周期? 最佳答案 查询bin/hbasehbck并找到在哪个机器根Regionserver中运行..您应该在hbck上获得-ROOT-isokay。确保你所有的区域服务器已启动并正在运行。使用startregionserver来启动regionserver

hadoop - HBase 批量加载会产生大量的 reducer 任务——任何解决方法

HBase批量加载(使用configureIncrementalLoad辅助方法)将作业配置为创建与hbase表中的区域一样多的reducer任务。因此,如果有几百个区域,那么该作业将产生数百个reducer任务。这在小型集群上可能会变得非常慢。是否可以使用MultipleOutputFormat或其他方式解决问题?谢谢 最佳答案 按区域分阶段减少减少会给您带来很多长期利益。一旦导入的数据在线,您就会获得数据局部性。您还可以确定何时将区域负载平衡到另一台服务器。我不会这么快进入更粗略的粒度。由于reduce阶段是单个文件写入,您应该

java - 关于如何为 Hbase 编写 Hadoop InputFormat/OutputFormat 的任何想法

有没有人有编写从Hbase获取日期的HadoopInputFormat/OutputFormat的经验?我想要比HbaseTableInputFormat更具体的东西,因为我的想法是将我的业务对象直接返回到mapred程序。这意味着能够构建一个可以分布在多行中的对象。谢谢你的帮助哎呀 最佳答案 您可以扩展RecordReader和/或FileInputFormat并在其中实现您需要执行的操作。也许扩展HbaseTableInputFormat并覆盖你需要不同行为的功能。(没有使用过HbaseTableInputFormat所以不确定

sql-server - 在 SQL 与 HBase 之间转换(同步)数据

我们正在彻底改造我们的产品,从Microsoft和.NET系列完全转向开源(其中一个原因是成本削减和数据呈指数级增长)。我们计划将我们的数据模型从SQLServer(关系数据)完全迁移到Hadoop(著名的键值对生态系统)。一开始,我们希望同时支持两个版本(比如1.0和新的v2.0)。为了保持数据的一致性,我们计划在两个系统之间同步数据,这是一项相当具有挑战性且容易出错的任务,但我们别无选择。从哪里开始有点困惑,我正在寻找专家社区。在这个方向上的任何策略/现有文献或任何其他类型的指导都会非常有帮助。 最佳答案 我不完全确定你的代码是

hadoop - 您会推荐使用 Hadoop/HBASE 吗?

我们有一个SQLserver2008和其中一个表,假设表A具有以下特征:每天,我们都会从其他系统获得多个包含数字数据的异构提要。提要在别处暂存,转换为符合A架构的格式。插入到A.架构如下:表格的行数可变。基本上我们必须在周末清除它,否则大小会影响性能。因此,一周内的尺寸范围为3m-15m行。由于一些新要求,我们预计到2012年底这个数字将增加1000万。所以我们会谈论10m-25m行。现在另外A中的数据永远不会改变。中间层可能使用A的数据,但它将是只读操作。但通常中间层甚至不关心内容。它通常(并非总是如此,但在80%的情况下)运行存储过程以生成报告并在其他系统中交付报告。这些表的客户通