草庐IT

hadoop - 在 HBase 中使用 MapReduce 计算平均计数

我有一个名为Log的表,其中每一行代表单个事件,并且具有这样的表结构info:date,info:ip_address,info:action,info:info数据的例子是这样的ColumnFamily:infodate|ip_address|action|info3March2014|191.2.2.2|delete|blabla4March2014|191.2.2.3|view|blabla5March2014|191.2.2.4|create|blabla3March2014|191.2.2.5|delete|blabla4March2014|191.2.2.5|create|

apache - Hbase 0.94.2 与 apache nutch 依赖的兼容性问题

我正在尝试安装apachenutch2.2.1,并在按照http://www.blogjava.net/paulwong/archive/2013/08/31/403513.html对配置文件进行了必要的更改后成功构建了它。教程。但即使在构建它之后我也无法抓取任何东西,经过数小时的检查我意识到我公司集群上的hbase版本是Hbase-0.94.2而apachenutch2.2.1的安装依赖是HBase0.90.4。由于hbase-0.90.4.jar与Hbase-0.94.2不兼容,因此当我尝试将url注入(inject)nutch时出现以下错误。请帮助我更改apachenutch的依

hadoop - HBase中单元格的理想大小是多少

我的文件包含巨大的blob字段,每个字段大小为10-15MB,我想存储在HBase中。单元格大小在10-15MB左右有什么缺点吗?如果是,那么列值的理想大小应该是多少才能在hbase中获得最佳性能? 最佳答案 是的,最好小于10MB,如果大于10MB,则需要更改hdfsblock和区域大小。http://wiki.apache.org/hadoop/Hbase/FAQ_Design#A3 关于hadoop-HBase中单元格的理想大小是多少,我们在StackOverflow上找到一个类似

apache - 在 HDP2.1 Hbase 中找不到 graceful_stop.sh

我正在阅读Hortonworks文档以从任何集群主机(http://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.1-latest/bk_system-admin-guide/content/admin_decommission-slave-nodes-3.html)中删除区域服务器。它使用graceful_stop.sh脚本。ApacheHbase书籍(https://hbase.apache.org/book/node.management.html)中描述了相同的脚本我试图找到这个脚本,但找不到。hbase@node~]$ls/usr/

hadoop - 区域服务器无法联系 HBase Master

我有一个由3个slave和1个master组成的Hadoop集群,上面有一个分别有3个RS和1个master的HBase集群。此外,在3台机器上还有一个Zookeeper集成。Hadoop集群以及Zookeeper整体正常运行。但是,HBase集群未能正确初始化。我通过运行./bin/start-hbase.sh启动HBase。这正确启动了HBaseMaster和区域服务器。hdfs中的hbase文件夹已正确设置。jpsonmasterhduser@master:~/hbase$jps5694HMaster3934JobHistoryServer3786NameNode3873Reso

java - 如何解决从 IntWritable 到 Mutation 的转换错误?映射减少 HBase

当我尝试将IntWritable从我的映射器传递到我的缩减器时出现以下错误:INFOmapreduce.Job:TaskId:attempt_1413976354988_0009_r_000000_1,Status:FAILEDError:java.lang.ClassCastException:org.apache.hadoop.io.IntWritablecannotbecasttoorg.apache.hadoop.hbase.client.Mutation这是我的映射器:publicclasstestMapperextendsTableMapper{publicvoidmap(

java - Hbase 分页过滤器返回更多键

我正在使用Hbase分页过滤器使用以下代码迭代表中的所有行Scanscan=newScan(Bytes.toBytes(key))Filterfilter=newPageFilter(10000);scan.setFilter(pageFilter);scan.setCaching(100000);//1lakhiknowitshouldbe10KbutthisshouldnotbetheresonforscannertoreturnmorekeysasicommentedoutthelinestillgettingmorekeysResultScannerresultScanner=

hadoop - 无法从 .bashrc 中删除 $HADOOP_PREFIX,这会在 hbase 中产生错误

我已经使用tar文件安装了hadoop。我在.bashrc文件中添加了$HADOOP_PREFIX=/usr/local/hadoop。一切正常。现在,我使用Horton的Ambari安装了Hadoop。我已经从.bashrc文件的所有系统中删除了以前的hadoop环境变量$HADOOP_PREFIX。现在,当我发出命令echo$HADOOP_PREFIX时,它仍然显示旧路径/usr/local/hadoop。有什么方法可以删除该变量。? 最佳答案 从.bahrc文件中删除$HADOOP_PREFIX然后运行这个命令unsetHAD

java - 使用 spark 读取 hbase 表

我有一个包含216列的表“Gazelle”,我想在javaPairRDD中获取它们的一些列。我试图点击此链接:Howtoreadfromhbaseusingspark还有这个:howtofetchallofdatafromhbasetableinspark为了导入我需要的所有jar,我已将此依赖项添加到我的pom文件中:'http://maven.apache.org/xsd/maven-4.0.0.xsd">4.0.0fr.aid.cimspark-poc1.0-SNAPSHOTorg.apache.sparkspark-core_2.101.1.0org.apache.hbaseh

hadoop - 节点/hbase 不在 ZooKeeper 中

在本地单节点Hadoop(HortonWorks)上运行PredictionIO时出现以下错误:StorageBackendConnectionsVerifyingMetaDataBackendVerifyingModelDataBackendVerifyingEventDataBackendERRORclient.HConnectionManager$HConnectionImplementation-Thenode/hbaseisnotinZooKeeper.Itshouldhavebeenwrittenbythemaster.Checkthevalueconfiguredin'z