hbase_草庐IT

hadoop - Flume 将数据从 MySQL 迁移到 Hadoop

请分享您的想法。需求是将MySQL数据库中的数据迁移到Hadoop/HBase中进行分析。数据应实时或接近实时迁移。水槽可以支持这个吗？什么是更好的方法。最佳答案据我了解，Flume并非为此而生。Flume基本上用于读取数据源(平面文件)之类的日志，并将它们以结构化的方式推送到接收器。Sqoop可以用，试试看http://archive.cloudera.com/cdh/3/sqoop/SqoopUserGuide.html 关于hadoop-Flume将数据从MySQL迁移到Had

hadoop section 中进 SqoopUserGuide hbase flume

hadoop - Hbase 0.92.1 二级索引示例

我正在hbase0.92.1中处理数百万行和数列。现在，我想知道如何使用协处理器创建二级索引。为此给出一些示例程序。请提供支持hbase0.92.1的程序。最佳答案使用HBase进行二级索引没有单一的好方法。您处理问题的方式将取决于您的数据和用例。二级索引的一些很好的讨论位于here 关于hadoop-Hbase0.92.1二级索引示例，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questi

hadoop Hbase section stackoverflow hdfs

java - 使用 MapReduce 将 CSV 文件加载到 Hbase 表中

我需要将csv文件的数据加载到hbase表中。我有上述格式的csv文件Csv文件:读取Detachcard.csvyearclassdaysmm1964920.58.819641013.64.219641111.84.71964127.70.1196517.30.8196526.50.11965310.81.41965413.23.51965516.17.01965619.09.21965718.710.71965819.910.91965916.68.2在上面的文件中，顶部第一行是列限定符名称，从第二行开始是列限定符的值。现在我需要使用mapreducing程序将这些数据加载到hba

MapReduce Hbase products section 1965 java hadoop

hadoop - 请澄清我对Hadoop/HBase的理解

我已经阅读白皮书和观看youtube视频半天了，相信我对这项技术有正确的理解，但在我开始我的项目之前，我想确保它是正确的。因此，这就是我认为我所知道的。在我了解hadoop和hbase的架构时，它们几乎是这样建模的-----------------------------------------|Mapreduce|-----------------------------------------|Hadoop|||-----------------------------------------|HDFS|---------------------------------------

澄清 hadoop HBase HDFS

hadoop - 线程 "main"org.apache.hadoop.mapred.InvalidJobConfException : Output directory not set 中的异常

嘿，你能帮我清除以下错误吗？当我运行Mapreduce作业fopr将数据从hdfs文件插入到hbase表中时，我得到了这个。使用HFileOutputFormat.class，之前我使用MultiTableOutputFormat.class运行相同的程序，它工作正常，但是在将数据插入hbase表时花费了很多时间。那么你能帮帮我吗……:)*job.setMapOutputKeyClass(ImmutableBytesWritable.class);job.setMapOutputValueClass(Put.class);job.setInputFormatClass(TextInpu

hadoop InvalidJobConfException section HFileOutputFormat class mapreduce hbase bigdata hadoop-streaming

eclipse - Eclipse 中的 Hadoop 和 Hbase 配置

我正在使用Windows7和Cygwin。我成功配置了Hadoop1.0.3和Hbase0.94.16，还创建了表并在表中插入数据。现在我想在eclipse(windows7)中配置Hadoop和Hbase，所以如果有任何想法请提出建议。谢谢。最佳答案展开了一整天终于得到了解决方案。这些是在EclipseIDE中配置Hbase的一些步骤。使用cygwin所有hbase运行成功。首先从hbase和hadooplib文件夹中获取一些jar文件(hadoop,hbase,hbase-test,common-logging,common

eclipse section Hbase li hadoop

hadoop - Cloudera-Agent 给出错误 - 'Hostname is invalid; it contains an underscore character.'

我正在尝试使用Cloudera-Manager安装程序在4个虚拟机上设置一个HBase集群(按照安装指南中的建议)。Cloudera-Manager版本为4.6.1，CDH版本为4.3，操作系统为CentOS-6.4。但是在安装包裹并且云时代代理尝试启动之后，报告以下错误:'主机名无效；它包含一个下划线字符。来自/usr/lib64/cmf/agent/src/cmf/agent.py:315.我可以在agent.py的第315行看到一个下划线('_')检查主机名。交叉检查了我们之前的CDH3.4设置，没有这样的验证。开发人员/用户是否可以确认检查是否相关以及下划线('_')是否未在C

Cloudera-Agent underscore 下划 section 39 hadoop hbase cloudera

hadoop - 配置多个 OpenTSDB 以使用单个 HBase 后端

我必须配置多个openTSDB才能将数据放入单个HBase。在所有TSD中，一个将在Hbase本地运行，而其他将在远程运行。为此，我尝试使用--zkquorum=xxx:xxx:xxx:xxx:YY的额外参数运行TSD，尽管它能够连接但在内部给出了一些异常。有人可以告诉我运行多个TSD以使用单个Hbase我必须配置什么吗？最佳答案如果您按照http://opentsdb.net/setup-hbase.html中的说明进行操作要设置单节点集群，您需要删除属性hbase.zookeeper.dns.interface和hbase.

OpenTSDB hadoop section code hbase

java - 从通过配置单元插入的 hbase 读取数据时出现问题

我已经创建了一个hbase-hive表。我在其中通过配置单元插入数据。CREATETABLEhivetest(cookiestring,timespentstring,pageviewsstring,visitstring,logdatestring)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"="m:timespent,m:pageviews,m:visit,m:logdate")TBLPROPERTIES("hbase.tab

时出配置单 strong hbase 34 java hadoop hive apache-zookeeper

hadoop - 即时消息的 HBASE 模式设计

我们一直在实现即时消息服务，并希望使用HBEASE来存储消息历史记录(并使用Redis来缓存正在进行的对话)。用户的传入消息看起来像Userid(给谁)时间邮件正文(与发件人、邮件正文组合......)关于架构设计:选项A:每行一条消息行键:md5(userid)+timesample列/valye:空/消息选项B:每行一个用户行键:md5(userid)column/valye:时间/消息你能帮我弄清楚pro和cont吗？谢谢聊天类型包括:peer-2-peer，群聊最佳答案据我所知，Facebook在消息系统使用hbase方

即时 hadoop section facebook noreferrer schema hbase