草庐IT

start-hbase

全部标签

java - Hbase 中的行数,其中一列具有特定值

我正在使用hbase将我的数据存储在hdfs中,我的表中有一个包含user_details的列族,我在其中存储用户值,例如-userdetails->userid->"ui011"userdetails->userName->"John"userdetails->emailid->"john@xyz.com"现在可以通过java和hbaseshell计算在用户名和电子邮件ID中具有特定值的行。我是hbase的新手,我们将不胜感激。 最佳答案 看看Hbase协处理器AggregationClient。AggregationClient

php - 无法启动 Hbase Thrift 服务器

我在运行Ubuntu12.04的ubuntu系统中以伪分布式模式安装了Hadoop1.2.1和Hbase0.94.8。一切正常,所有守护进程都在运行。为了使用php访问hbase,我下载并安装了thrift0.9.1。$thrift-versionThriftversion0.9.1但是当我尝试使用命令启动thrift服务器时$/usr/lib/hbase/hbase-0.94.8/bin/hbasethriftstartthrift服务器开始启动。但在某个时刻终端挂起。终端的最后几行是14/02/1915:30:48INFOmortbay.log:Loggingtoorg.slf4j

json - 使用 Hive 向 Hbase 中插入数据(JSON 文件)

我已经使用hive在hbase中创建了一个表:hive>CREATETABLEhbase_table_emp(idint,namestring,rolestring)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,cf1:name,cf1:role")TBLPROPERTIES("hbase.table.name"="emp");并创建了另一个表来加载数据:hive>createtabletestemp(idint,na

hadoop - HBase mapReduce TableOutputFormat如何使用Flush和WAL

因此,当从使用TableOutputFormat的MapReduce作业写入HBase时,它​​多久写入一次HBase。我不认为它会为每一行执行一个put命令。在MapReduce中使用时如何控制AutoFlush和WriteAheadLog(WAL)? 最佳答案 TableOutputFormat禁用AutoFlush并使用在hbase.client.write.buffer指定的写入缓冲区(默认为2MB),一旦缓冲区已满,它会自动刷新到HBase。您可以通过将属性添加到作业配置来更改它:config.set("hbase.cli

hadoop - 作业跟踪器和名称节点不以 start-all.sh 开头

我正在尝试安装hadoop单节点,但它无法正常工作。当我执行start-all.shnamenode和jobtracker时,不要启动。您是否在我的文件中看到什么可能是错误的,所以我得到了这个结果?hadoopjps命令的结果:14878日元14823任务追踪器14605二级名称节点14456数据节点start-all.sh命令的结果:admin@vm-sgd10:/usr/local$start-all.shstartingnamenode,loggingto/usr/local/hadoop/libexec/../logs/hadoop-admin-namenode-vm-10.v

hadoop - HBase 未连接到 ZooKeeper

我正在努力让我的HBaseshell运行。它在主题行中抛出上述异常。我检查过hbase-site.xml与hadoop完美匹配。请帮忙。我挣扎了2天,有一个项目到期。我附上hadoop和hbase的两个xml文件。hbase-site.xmlhbase.rootdirhdfs://localhost:54310/hbasehbase.zookeeper.property.dataDir/home/hduser/zookeeperhbase.zookeeper.property.clientPort2222PropertyfromZooKeeper'sconfigzoo.cfg.Thep

java - 为什么HBase RowKey、ColumnKey和value是二进制值(字节),而不是String?

HBase值由4个键索引:TableName、RowKey,列键,时间戳。地点:TableName是一个字符串RowKey和ColumnKey是二进制值(Java类型byte[])Timestamp是一个64位整数(Java类型long)value是一个未解释的字节数组(Java™类型byte[])二进制数据以Base64编码以通过网络传输。为什么键和值使用字节而不是字符串存储? 最佳答案 因为您可能需要在限定符和值中存储二进制数据。例如,我们有这样的前缀限定符:'prefix[binaryint64id]'并将序列化的protob

apache - 有一个不可序列化的结果 : org. apache.hadoop.hbase.client.Result

privatestaticJavaPairRDDgetCompanyDataRDD(JavaSparkContextsc)throwsIOException{returnsc.newAPIHadoopRDD(companyDAO.getCompnayDataConfiguration(),TableInputFormat.class,ImmutableBytesWritable.class,Result.class).mapToPair(newPairFunction,Integer,Result>(){publicTuple2call(Tuple2t)throwsException{

hadoop - hadoop 上的 Hbase 未在分布式模式下连接

您好,我正在尝试在HADOOP(hadoop-2.7.0)上设置HBASE(hbase-0.98.12-hadoop2)Hadoop在localhost:560070上运行,运行良好。我的hbase-site.xml如下所示hbase.rootdirhdfs://localhost:9000/hbasehbase.cluster.distributedtruehbase.zookeeper.quorumlocalhostdfs.replication1-->hbase.zookeeper.property.clientPort2181当我启动./start-hbase.sh时,我在日志

macos - Hadoop: start-dfs/start-yarn.sh: 没有那个文件或目录

尽管我检查了两个文件都存在于目录中并且hadoop可以访问这些文件夹,但它还是给了我上述两个错误。我使用以下教程安装了hadoop:link出了什么问题,如何解决? 最佳答案 您可能没有导出此目录的路径。尝试提供/entirepath/start-dfs.sh。同样在您的.bash_rc文件中添加HADOOP_HOME=/Pathtohadoopinstallationfolder。使用命令source.bash_rc获取bash_rc文件。 关于macos-Hadoop:start-d