hbase-unsecure

hadoop - PIG - HBASE - 类型转换值

我正在使用PIG处理HBase表中的行。HBase表中的值存储为字节数组。我不知道我是否必须编写一个将字节数组转换为各种类型的UDF，或者pig是否会自动执行此操作。我有以下脚本:raw=LOAD'hbase://TABLE'USINGorg.apache.pig.backend.hadoop.hbase.HBaseStorage('CF:I')AS(product_id:bytearray);ids=FOREACHrawGENERATE(int)product_id;dumpids;我得到一个括号'()'的列表。根据docs，它应该工作。我检查了hbaseshell中的值它们都是va

hadoop - 使用 ImportTsv 在 hbase 中插入数据时出现问题

我尝试使用以下命令将数据插入到hbase中:hbaseorg.apache.hadoop.hbase.mapreduce.ImportTsv-Dimporttsv.columns=HBASE_ROW_KEY,f:pageviews,f:visit-Dimporttsv.separator=\001-Dimporttsv.bulk.output=outputmodelvar/000000.gzhbaseorg.apache.hadoop.hbase.mapreduce.LoadIncrementalHFilesmodelvaroutput其中modelvar是假设存储数据的最终hbase

时出 ImportTsv separator code hadoop hbase hive

apache - 在 hadoop 集群上使用 HBase 设置 Nutch 2.2.1

我已引用本教程(http://wiki.apache.org/nutch/Nutch2Tutorial)来设置Nutch2.2.1.withHbase。我已经完成了教程中给出的设置，但是没有明确提到如何爬取数据并将数据存储到Hbase表中。你能给我推荐一些相关的链接/书籍吗？最佳答案对我最有帮助的是:http://sujitpal.blogspot.cz/2011/01/exploring-nutch-20-hbase-storage.html映射到hbase定义在这里NUTCH_HOME/conf/gora-hbase-map

apache hadoop section hbase code web-crawler nutch

java - 使用 MapReduce 作业的 HBase 批量删除

我正在尝试使用mapreduce作业从Hbase表中删除行。我收到以下错误。java.lang.ClassCastException:org.apache.hadoop.hbase.client.Deletecannotbecasttoorg.apache.hadoop.hbase.KeyValueatorg.apache.hadoop.hbase.mapreduce.HFileOutputFormat$1.write(HFileOutputFormat.java:124)atorg.apache.hadoop.mapred.ReduceTask$NewTrackingRecordWr

MapReduce HBase apache hadoop code java scalability

hadoop - 如何从ftp服务器导入csv文件到hadoop(HDFS/HIVE/HBASE)？

我的源文件以csv格式位于ftp服务器中。我想将这些文件导入HDFS进行进一步处理。我不知道如何获取这些csv文件。谁能帮我解决这个问题？最佳答案您可以将此过程分为两步并将文件上传到hdfs。第一步:从ftp服务器下载文件并存储在本地。这应该有所帮助:TransferfilesfromFTPservertolocalunixserver第2步:在本地拥有文件后，您可以使用hadoopfs-put将文件传输到hdfs。例子。如果你的文件名是temp.csv你可以这样做:hadoopfs-puttemp.csv$hadoop_pat

hadoop HBASE section stackoverflow hive

hadoop - Hbase 主机未运行

我正在尝试以伪分布式模式运行Hbase。我关注了thislink.我使用的是ubuntu版本12.04Hbase版本0.94.8Hadoop版本2.4.0在hbase/conf/hbase-env.sh中，我添加了以下内容exportJAVA_HOME=/usr/lib/jvm/jdk1.7.0_25exportHBASE_REGIONSERVERS=/usr/lib/hbase/hbase-0.94.8/conf/regionserversexportHBASE_MANAGES_ZK=true然后我在bashrc文件中设置HBASE_HOME路径在hbase/conf/hbase-s

hadoop Hbase property gt

hadoop - 如何让 hbase 区域服务器监听 0.0.0.0？

我的Hbase区域服务器正在监听127.0.0.1。如何让它在0.0.0.0上列出？我尝试更改hbase.regionserver.info.bindAddress的值，但这似乎不起作用。最佳答案为了在(伪)分布式模式下的外部接口(interface)上公开端口60020，HBase希望您的/etc/hosts以某种方式显示。如果您运行Ubuntu，您可能会在/etc/hosts中找到类似这样的内容:(我假设您的主机名是regionserver)127.0.0.1localhost127.0.1.1regionserver选择具

hadoop hbase section code regionserver cloudera cloudera-cdh

hadoop - hbase作为Web应用程序中的数据库

关于在真实网络应用程序中使用hadoop或相关技术的一个大问题。我只是想了解Web应用程序如何使用hbase作为其数据库。我的意思是，这是大数据应用程序所做的事情，还是它们使用普通数据库并仅使用这些技术进行分析？有一个带有Hbase数据库或类似东西的在线商店可以吗？最佳答案是的，将hbase作为后端非常好。我正在做些什么来完成这项工作，(我的网站上运行着一个在线社区和论坛)1.使用thrift编写C#代码访问Hbase，非常简单易行。(Thrift是跨语言绑定(bind)平台，Java对HBase来说只是一等公民!)2.使用Am

hadoop hbase section bigdata

hadoop - 连接异常 : connect error: No such file or directory when trying to connect to '50010' using importtsv on hbase

我在hdfs-site.xml和hbase-site.xml上配置了短路设置。我在hbase上运行importtsv以将数据从HDFS导入到Hbase集群上的HBase。我查看了每个数据节点上的日志，所有数据节点都有我对标题所说的ConnectException。2017-03-3121:59:01,273WARN[main]org.apache.hadoop.hdfs.shortcircuit.DomainSocketFactory:errorcreatingDomainSocketjava.net.ConnectException:connect(2)error:Nosuchfil

connect amp property gt lt hadoop hbase hadoop2

hadoop - HBase 按值排序

我正在使用SingleColumnValueFilter、scan、getScanner，并从hbase表中检索值。结果值在Id-vise行中排序。但我希望结果在值(value)虎钳中排序。示例:HbaseTable:RowId|col1:amount|col1:balance15000100023000150034000500现在，当我在WebUI(我自定义的)中选择金额时。然后，Result应该按amount-vise排序。ExpectedResultafterchosenamountcolumn:RowId|**col1:amount**|col1:balance23000150

hadoop HBase section amount code cassandra cloudera hadoop-plugins

132 133 134135136 137 138