草庐IT

hbase-shell

全部标签

解决Hbase报错:ERROR: Can‘t get master address from ZooKeeper; znode data == null

文章目录问题描述解决方案问题描述报错了:这啥公司啊,怎么给的文档怎么错这么多,起一服务,集群里总有几个组件报错继上次Flume脚本,使用hdfssink报错了以后,hbase又报错了,报错提示如下:hbase(main):001:0>listTABLEERROR:Can'tgetmasteraddressfromZooKeeper;znodedata==nullHereissomehelpforthiscommand:Listalltablesinhbase.Optionalregularexpressionparametercouldbeusedtofiltertheoutput.Examp

hadoop - 如何配置 hbase 写入文件系统?

我已经在suselinuxbox中安装了hbase。hbase-site.xml文件如下所示:hbase.rootdirfile:///app/data.1/dashboard/hbasehbase.zookeeper.property.dataDir/app/data.1/dashboard/zookeeper我需要存储空间来写入/app/data.1文件系统,因为它超过50TB。但是,看起来hbase存储正在像这样写入/tmp文件系统:6495573175064-rw-rw-rw-1rootroot3251261936Jul1908:08/tmp/hbase-root/hbase/

shell - 如何将一个目录中的多个CSV表递归加载到Hive中

我已经创建了一个具有指定模式但没有数据的外部Hive表,比如表A。现在假设我在HDFS目录中有CSV文件,按以下方式组织:20150718/dir1/dir2/file1.csv20150718/dir1/dir2/file2.csv...................20150718/dir1/dir2/..../dirN/file10000.csv换句话说,这些文件可能在目录20150718中的多个不同级别的目录中。如何在一个Hive/shell命令中加载这些CSV文件?另一个注意事项是我计划随着时间的推移根据日期创建分区,那么我应该如何进行?仍然是新的Hive用户,非常感谢您的

hadoop - 如何将 Microsoft SQL Server 中的数据导入 HBase

我已经使用ClouderaManager和CDH5.4在集群系统(1Master,2Slaves,基于Ubuntu的高配置)上成功安装了ApacheHadoop我想将数据从MicrosoftSQL服务器导入到HBase(基于列的hadoop数据库),截至目前,我已经从SQL服务器生成CSV文件并使用HBase浏览器(ClouderaManager中的Hue应用程序)将CSV导入到HBase。如果有任何方法可以直接将SQL服务器数据导入HBase,那对我会有帮助,我听说Sqoop应用程序已经完成了将数据从RDBMS导入Hadoop系统(即使我没有尝试这个,我假设这会导入CSV文件到Had

hadoop - HBase 索引器与 Apache HBase 一起工作

我在使用ApacheHbase构建时遇到以下错误。我正在运行以下邮件mvn-ecleaninstall-DskipTests-Dhbase.api=0.98```[错误]构建错误[信息]----------------------------------------------------------------------[INFO]构建POM时出错(可能不是该项目的POM)。项目ID:null:akuma:jar:1.9原因:找不到父项目:org.kohsuke:pom项目:null:akuma:jar:1.9项目null:akuma:jar:1.9[信息]------------

hadoop - Hive - Hbase 集成事务更新与时间戳

我是hadoop和大数据的新手,这几天只是想弄清楚将我的数据存储移动到hbase的可能性,我遇到了一个问题,你们中的一些人可能会帮助我。所以它就像,我有一个hbase表"hbase_testTable",其列族为:"ColFam1"。我已将"ColFam1"的版本设置为10,因为我必须维护此列系列的最多10次更新的历史记录。哪个工作正常。当我尝试通过具有显式时间戳值的hbaseshell添加新行时,它工作正常。基本上我想使用时间戳作为我的版本控制。所以我指定时间戳为put'hbase_testTable''1001','ColFam1:q1','1000$',3'3'是我的版本。一切正

mysql - 在 hbase 中使用 enclosed by

我有tsv形式的数据,我想将它插入到hbase中,问题是每个字段都用“'”(单引号)括起来。如何在导入命令中提供它:hbaseorg.apache.hadoop.hbase.mapreduce.ImportTsv-Dimporttsv.bulk.output=output1-Dimporttsv.columns=HBASE_ROW_KEY,data:employee_id,data:employee_name,data:designation,data:telephone_number,data:artist_mbid,employees/emp我发现hbase可用的选项有:在http

MySQL 和 HBase 连接

我是Hadoop新手。我想连续从mysql获取数据到Hbase(持续集成),反之亦然。有什么办法可以做这种事情吗?? 最佳答案 你应该看看ApacheSqoop:一种设计用于在Hadoop和数据存储(例如关系数据库)之间传输大量数据的工具。 关于MySQL和HBase连接,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/33436794/

java - 如何使 HBase 主服务器和区域服务器进程绑定(bind)到公共(public) IP?

在主服务器和区域服务器上使用netstat时,我可以看到主服务器正在监听私有(private)ips:16000,而区域服务器正在监听私有(private)ip:16020。有没有办法强制这些进程绑定(bind)到公共(public)IP? 最佳答案 摘自《Hbase权威指南》一书(我自己没试过):HBase使用本地主机名来self报告其IP地址。正向和反向DNS解析都应该有效。您可以通过运行以下命令来验证设置是否正确用于正向DNS查找:$ping-c1$(hostname)您需要确保它报告服务器的公共(public)IP地址而不是

hadoop - 如何在 Hadoop 中执行类似 shell 脚本的操作

我在执行剪切、尾部、排序等操作时遇到了问题,因为我能够在UnixShell环境中对文件执行这些操作。我遇到的情况是我想要我的文件中没有按时间戳排序的最高时间戳并将其存储在“X”中,然后在执行MR时将“X”作为参数传递给我的MapReducer驱动程序类工作。在本地模式下很容易做到这一点:cut-d,-f>>|sort-n|tail-1这给了我最大的时间戳。现在在分布式模式下,如何去执行这样的操作,或者换句话说,我们可以使用什么技巧来帮助解决这样的问题,我不希望触发一个MapReduce作业来找到最大时间戳,然后将它传递给另一个MapReduce作业。请建议。如果需要更多信息,请告诉我。