草庐IT

hadoop - HBase 区域服务器在 tsv 导入时不断崩溃

我正在尝试使用以下命令将制表符分隔的HDFS文件(3.5G)加载到HBASE中,其中包含4500万条记录hbaseorg.apache.hadoop.hbase.mapreduce.ImportTsv-Dimporttsv.columns=HBASE_ROW_KEY,description:part_descriptionpart/user/sw/spark_search/part_description_data文件片段45-573ConnCircularAdapterF/M11POSST1PortCA3100E14S-4P-B-03ConnCircularPIN1POSCrimpS

hadoop - Hbase 区域服务器无法与 HMaster 通信

我无法在分布式模式下设置hbase。当我在一台机器上设置它时它工作正常(独立模式)。我的Zookeeper、hmaster和区域服务器正常启动。但是当我去hbaseshell并寻找状态时。它显示了0个区域服务器。我附上了我的区域服务器日志。加上我的主机(namenode)和从机(datanode)的主机文件。我已经尝试了stackoverflow上提供的所有用于更改主机文件的P&C,但对我没有用。2013-06-2415:03:45,844INFOorg.apache.zookeeper.ClientCnxn:Openingsocketconnectiontoservernaresh-

hadoop - 区域服务器死亡的原因

我有一个在亚马逊Ec2上运行的3节点hbase集群。哪个工作得很好。现在,我尝试使用两个单独的插入查询将数据从EMR插入到EC2。所以首先插入查询工作得很好并插入数据,然后我所有的区域服务器都死了。那么,您能否建议我调试此问题的一般准则以及为什么区域服务器通常会死机?此外,即使我在一段时间后再次明确地启动区域服务器,它们也会死掉。更新问题:早些时候我认为这可能是一个问题,因为HBASE_HEAPSIZE默认设置为1GB。但我也将其增加到5.5Gb,但区域服务器仍处于死机状态。以下是我在每个区域服务器死后获得的日志。2013-10-0718:16:27,949WARNorg.apache

java - Hbase 表不一致[区域未部署在任何区域服务器上]

在一个小型的HBase集群中,所有的从节点都被重启了。当我启动HBase服务时,其中一个表(测试)变得不一致。在HDFS中,一些block丢失了(hbaseblock)。所以它处于安全模式。我给出了safemode-leave命令。然后HBase表(测试)变得不一致。我执行了以下提到的操作:我执行了几次“hbasehbck”。为表“测试”找到2个不一致。错误:区域{meta=>test,1m\x00\x03\x1B\x15,1393439284371.4c213a47bba83c47075f21fec7c6d862.,hdfs=>hdfs://master:9000/hbase/tes

java - 使用 hbase API 获取区域名称的正确方法

我正在尝试使用HBaseAPI获取“表”的“区域名称”。设置如下:Hbase伪分布式安装(0.98.7版本)。Hadoop2.5.1安装。Hbase包含很少的用于测试目的的表。有关可用区域的信息显示在WebUI的下方。“test_table”表对应的“regionname”被特意高亮了。现在,我一直在尝试使用以下代码从基于java的hbaseAPI获取这些区域信息。voidscanTable(StringtabName){org.apache.hadoop.conf.Configurationconfig=HBaseConfiguration.create();try{HTableta

hadoop - 获取 Hbase 异常没有区域通过

嗨,我是Hbase的新手,我正在尝试学习如何使用MapReduce将批量数据加载到Hbase表但我正在低于异常Exceptioninthread"main"java.lang.IllegalArgumentException:Noregionspassedatorg.apache.hadoop.hbase.mapreduce.HFileOutputFormat2.writePartitions(HFileOutputFormat2.java:307)atorg.apache.hadoop.hbase.mapreduce.HFileOutputFormat2.configureParti

hadoop - Hbase、区域服务器、存储文件大小、索引

您是否对Hbase中的索引表使用压缩?如果是这样,您使用什么类型的压缩?我注意到我的索引表的大小每天都很大,而且每天都在增长……添加新存储后,大小甚至更大。我有例如表A,其大小为108.3G在/apps/hbase/data/data/default中,大小为380.0G的索引表,并且在/apps/hbase/data/archive/data/default中,索引表的大小为1.2T你能建议我如何处理索引表的大小吗?为什么HDFS上归档的数据这么大?/apps/hbase/data/archive/data/default能否以某种方式管理HDFS上存档目录的大小?存档占用了我HDF

hadoop - 手动修复Hbase表重叠(多区域具有相同的启动键)

我是通过Java客户端将数据插入到Hbase中的。但是,区域服务器突然崩溃了。所以我重新启动了hbase,之后hmaster就不运行了。当我运行修复工具-hbaseorg.apache.hadoop.hbase.util.hbck.OfflineMetaRepair时,我得到了以下原因:ERROR:(regionTABLE_NAME,rowkey_value,region_name_1)Multipleregionshavethesamestartkey:rowkey_valueERROR:(regionTABLE_NAME,rowkey_value,region_name_2)Mul

hadoop - Hbase 区域在不应该的时候 split

我们有一些表配置了DelimitedKeyPrefixRegionSplitPolicy(继承自IncreasingToUpperBoundRegionSplitPolicy),内存存储刷新大小为128M,表MAX_FILESIZE约为20GB。根据我们的计算,在区域大小达到20GB(4^3*256M=16GB)之前,每个服务器不应获得超过5个区域,但每个区域服务器有7-15个区域。我们之前将它们组合起来以获得正确的数字,但随后它们又分开了。我们使用的是hbase0.98.4,表描述显示{TABLE_ATTRIBUTES=>{MAX_FILESIZE=>'21474836480'...

hadoop - hbase 区域服务器未与主服务器通信

我正在尝试让bhase集群正常工作。两个主服务器和两个区域服务器。我的问题是regionserver提示告诉主人他们已经起来了。:2016-07-0116:10:21,879WARN[regionserver/nbd-hadoop-data1/153.77.130.27:60020]**regionserver.HRegionServer:reportForDutyfailed;sleepingandthenretrying.**2016-07-0116:10:24,879INFO[regionserver/nbd-hadoop-data1/153.77.130.27:60020]**