草庐IT

HBASE_CLASSPATH

全部标签

基于前置搭建的 Hbase 环境上配置 Spark 开发环境

1.准备工作及说明本次安装考虑在不影响前置环境(Hbase环境)的基础下添加Spark的工作环境Spark集群部署采用yarn模式进行资源调度管理,这样部署更加简单,因Hadoop在之前已经进行集群安装,Spark是提交jar到yarn中进行运行,只需要在任意一台中安装Spark客户端即可,而又因为是集群模式可能导致作业在未安装Spark的节点上运行,推荐的做法是上传这些jar到hdfs中,并配置hdfs作为依赖,为了偷懒不想改配置文件该步骤我懒得去搞,直接在三台节点中都安装同样的客户端,如有新的依赖加入直接在三台中上传依赖(保障三台环境完全一致)即可。下载spark-2.3.2-bin-ha

Hbase教程

1、HBase简介1、Hbase是什么? Hbase是一个分布式的存储海量数据的Nosql数据库2、Hbase的应用场景 hbase一般用于实时数据存储3、Hbase数据模型 Table:hbase的数据是以表的形式存储 Region:table会切分为多个region,将region分配在不同机器存储,从而实现分布式保存 Store:Region会根据列簇划分为多个store,store的个数=列簇的个数 列簇:Hbase的表结构,所以在创建hbase表的时候必须执行列簇的名称,hbase的数据全部是以byte[]形式存储 Namespace:命名空间,相当于mysql的库 Row:行,唯一

hbase启动常见问题

**hbase启动常见问题**使用xshell连接5台虚拟机,使用具有root权限的用户登录进行操作,我的是admin使用date命令观察集群时间是否同步,若时间相差在1分钟以内,则无需同步,若相差的时间>1minutes则需使用以下命令:su-rootdate-s“2022-4-2019:43:20”hwclock-w启动zookeeper(5台主机都需要启动),使用如下命令:zkServer.shstart#启动zookeeper的命令zkServer.shstatus#查看zookeeper的状态5台主机要观察leader的选举状态,若出现4台follower,1台leader则启动成功

node.js - HBase:Thrift vs Rest 性能

我知道StackOverflow上有几篇关于HBase的REST和Thrift的帖子,但我想稍微关注一下性能问题。我一直在使用Node.js中的以下库来连接到HBase实例:Node-hbase:https://github.com/wdavidw/node-hbaseNode节俭:https://github.com/apache/thrift/tree/trunk/lib/nodejs在弄清楚为什么我无法从Thrift网关获得响应的一些麻烦之后,我终于让两个脚本都运行了,结果如下(每个输出相当于完成了1000个操作):┌─[mt@Marcs-MacBook-Pro]─[~/Sour

node.js - HBase:Thrift vs Rest 性能

我知道StackOverflow上有几篇关于HBase的REST和Thrift的帖子,但我想稍微关注一下性能问题。我一直在使用Node.js中的以下库来连接到HBase实例:Node-hbase:https://github.com/wdavidw/node-hbaseNode节俭:https://github.com/apache/thrift/tree/trunk/lib/nodejs在弄清楚为什么我无法从Thrift网关获得响应的一些麻烦之后,我终于让两个脚本都运行了,结果如下(每个输出相当于完成了1000个操作):┌─[mt@Marcs-MacBook-Pro]─[~/Sour

HBase高手之路7—HBase之全文检索Phoneix

文章目录HBase之全文检索Phoenix一、全文检索二、全文检索工具phoenix简介1.简介2.使用Phoenix是否会影响HBase性能3.哪些公司在使用Phoenix4.官方性能测试4.1Phoenix对标Hive(基于HDFS和HBase)4.2Phoenix对标Impala4.3关于上述官网两张性能测试的说明三、OLTP和OLAP1.OLAP2.OLTP四、Phoenix的安装1.下载2.上传服务器3.解压4.修改HBase的配置文件hbase-site.xml5.分发HBase的配置文件到其他节点6.复制依赖包1)复制phoenix的服务器端jar包到master和worker的

Hbase命令行语句

Hbase命令行语句1、先启动Hadoop2、jps查看进程一共6个才能继续3、启动Hbase,jps一共9个进程才能继续4、使用hbaseshell进入命令行模式5、Hbase基础命令行语句1)status—查看状态2)list—查看所有表格3)version—查看安装hbase版本4)help—查看所有命令帮助5)desc—查看表格详情,是否有效,列族信息,读写缓存,缓存大小等语法:desc‘表格名’6)create—创建表格i)普通表格语法:create'表格名',‘列族名1’,‘列族名2’,‘列族名n’ii)允许多版本时间戳的表格语法:create'表格名',{NAME=>'列族1',

HBase中master正常启动,自动关闭——原因以及解决办法

在启动HBase时遇到的问题regionserver一直在运行,而master启动之后,过一会自动停止,因为master停止,所以也无法访问hbase管理web页面。可能的原因:虚拟机的时间不同步防火墙没有关闭hbase中的hbase-site.xml文件中的属性值(hbase.rootdir)主机端口不一致缺少配置解决方法虚拟机时间不同步,虚拟机集群时间不同步导致hbase错误启动,将三者时间更改即可防火墙没有关闭,通过集群互相ping,查看是否能ping通pinghadoop102pinghadoop103pinghadoop104  3.  hbase-site.xml中的hbase.r

Hive、Hbase、TiDB、Gbase的区别

在数据库不断发展的今天,尤其是大数据技术的发展,不断的涌现出各种海量数据存储及分析的数据库及相关工具令人演化缭乱,有的基于Hadoop构建,有的基于分布式理论自行构建,但是这些工具和数据库之间究竟有什么区别,都使用于什么场景,在查询了相关材料之后我进行了一个简单的总结,以备后用。仅供参考。1、Hive(基于Hadoop数据仓库工具)Hive是一种类Sql的引擎,并且运行MapReduce的任务。是将类似SQL的语句转换成MapReduce的任务进行执行;Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类似SQL查询的功能;Hive是一个基于hadoop的

HBase的编程实践(实验3_熟悉常用的HBase操作)

一、Hbase中使用Shell命令:① HBase中创建表:(create命令:第一个变量是表名,然后是列族名)语法:create'表名称','列族名称1','列族名称2','列族名称N'create'student','Sname','Ssex','Sage','Sdept','course'通过命令describe'student' 进行查看表的结构:(desc‘表名’,查看表的结构)接下来是hbase常规操作(增删改查) ✿增加数据② put:(put命令:第一个变量是表名,第二个变量是行键,第三个变量开始就是添加列族情况啦(列限定符可选) 注意put命令:一次只能为一个表的一行数据的一