hive-hbase

HBase 基础

HBase基础HBase1.HBase简介1.1HBase定义1.2HBase数据模型1.2.1HBase逻辑结构1.2.2HBase物理存储结构1.2.3数据模型1.3HBase基本架构2.HBase环境安装2.1HBase安装部署2.1.1HBase本地按照2.1.2HBase伪分布模式安装2.1.3HBase集群安装2.2HBaseShell操作2.2.1DDL操作2.2.2DML操作3.HBase的JavaAPIHBase1.HBase简介1.1HBase定义HBase是一种分布式、可扩展、支持海量数据存储的NOSQL数据库。1.2HBase数据模型逻辑上，HBase的数据模型同关系型

基础 HBase span class token 数据库大数据

大数据Hive--查询

文章目录一、查询1.1基础语法1.2基本查询1.2.1数据准备1.2.2全表和特定列查询1.2.3列别名1.2.4Limit语句1.2.5Where语句1.2.6关系运算函数1.2.7逻辑运算函数1.2.8聚合函数1.3分组1.3.1GroupBy语句1.3.2Having语句1.4Join语句1.4.1等值Join1.4.2表的别名1.4.3内连接1.4.4左外连接1.4.5右外连接1.4.6满外连接1.4.7多表连接1.4.8笛卡尔积1.4.9联合（union&unionall）1.5排序1.5.1全局排序（OrderBy）1.5.2每个Reduce内部排序（SortBy）1.5.3分区（

数据查询 span class token 大数据 hive hadoop

Hive命令调优大全

–explain语法查询**–explain解析执行计划–以下优化为hive层面优化,常开****–读取零拷贝sethive.exec.orc.zerocopy=true;–默认false–关联优化器sethive.optimize.correlation=true;–默认false–fetch本地抓取sethive.fetch.task.conversion=minimal;–新版本默认more,老版本默认minimal–针对小文件开启本地模式sethive.exec.mode.local.auto=true;–默认false–并行执行任务sethive.exec.parallel=true

命令大全 strong 默认 hive hadoop 数据仓库

hbase可视化：hbaseGUI的安装与使用

使用hbaseGUI远程连接hbase查询1.hbaseGUI的官方介绍git官方https://github.com/Observe-secretly/HbaseGUI2.解压Hbase-GUI-1.2.5.zip将Hbase-GUI-1.2.5.zip解压到D盘中3.解压driver.zipWindows解压到用户主目录/.hbase-gui-conf/下。Mac用户解压到~/.hbase-gui-conf/例如:window用户为admin，就把driver.zip解压到C:\Users\admin.hbase-gui-conf中4.连接hbase双击start.bat填写配置备注：给连

可视化可视 img img-blog 插入 hbase 数据库大数据

Hive实战：词频统计

文章目录一、实战概述二、提出任务三、完成任务（一）准备数据文件1、在虚拟机上创建文本文件2、将文本文件上传到HDFS指定目录（二）实现步骤1、启动HiveMetastore服务2、启动Hive客户端3、基于HDFS文件创建外部表4、查询单词表，所有单词成一列5、基于查询结果创建视图6、基于视图进行分组统计7、基于嵌套查询一步搞定一、实战概述在本次实战中，我们任务是在大数据环境下使用Hive进行词频统计。首先，我们在master虚拟机上创建了一个名为test.txt的文本文件，内容包含一些关键词的句子。接着，我们将该文本文件上传到HDFS的/hivewc/input目录，作为数据源。随后，我们启

词频实战 code xff0c xff hive hadoop

使用Sqoop将Hive数据导出到TiDB

关系型数据库与大数据平台之间的数据传输之前写过一些使用Sqoop将数据在HDFS与MySQL互导使用Sqoop将SQLServer视图中数据导入Hive使用DataX将Hive与MySQL中的表互导使用Sqoop将Hive数据导出到TiDB虽然没写过，但网上一堆写的，那为什么我要专门写一下呢？我发现一些大家可能会忽略但很重要的地方！所以，请继续看下去，你肯定会有收获的！！！文章目录1建Hive表2建TiDB表3Sqoop脚本4问题排查5问题处理1建Hive表注意分隔符‘\001’，用别的也可以，但要和Sqoop命令一致createtabletest_table(contract_nostrin

导出使用 span class token hive sqoop tidb

最近怎么流量涨这么多？那我开始讲Hive特性了！

Hive架构原理a.用户接口：ClientCLI（Hiveshell）、JDBC/ODBC(java访问hive)、HiveWEBUI（浏览器访问hive）和Thrift服务器b.驱动器：Driver解析器（SQLParser）：将SQL字符串转换成抽象语法树AST，这一步一般都用第三方工具库完成，比如antlr；对AST进行语法分析，比如表是否存在、字段是否存在、SQL语义是否有误。编译器（PhysicalPlan）：将AST编译生成逻辑执行计划优化器（QueryOptimizer）：对逻辑执行计划进行优化。执行器（Execution）：把逻辑执行计划转换成可以运行的物理计划对于Hive来说

流量特性 xff xff0c 数据 hive hadoop 数据仓库

HIVE窗口函数

什么是窗口函数hive中开窗函数通过over关键字声明；窗口函数，准确地说，函数在窗口中的应用；比如sum函数不仅可在groupby后聚合，在可在窗口中应用；hive中groupby算子和开窗over，shuffle的逻辑都是一样的；map时生成键值对，key在groupby中是groupby后跟的字段，在over中是partitionby后跟的字段；selectgroup_name,sum(sales)assum_salesfromdw_sec_saler_infogroupbygroup_name中分组（key）字段是group_nameselectgroup_name,id,sum(sa

函数窗口 span class xff hive hadoop 数据仓库开窗函数

【kettle】pdi/data-integration 集成kerberos认证连接hdfs、hive或spark thriftserver

一、背景kerberos认证是比较底层的认证，掌握好了用起来比较简单。kettle完成kerberos认证后会存储认证信息在jvm中，之后直接连接hive就可以了无需提供额外的用户信息。sparkthriftserver本质就是通过hivejdbc协议连接并运行sparksql任务。二、思路kettle中可以使用js调用java类的方法。编写一个jar放到kettle的lib目录下并。在启动kettle后会自动加载此jar中的类。编写一个javascript转换完成kerbero即可。二、kerberos认证模块开发准备使用scala语言完成此项目。hadoop集群版本:cdh-6.2.0ke

data-integration thriftserver span class token hive spark hadoop

Hive 的安装与使用

目录1安装MySql2安装Hive3Hive元数据配置到MySql4启动Hive5Hive常用交互命令6Hive常见属性配置Hive官网1安装MySql为什么需要安装MySql?原因在于Hive默认使用的元数据库为derby，开启Hive之后就会占用元数据库，且不与其他客户端共享数据，如果想多窗口操作就会报错，操作比较局限。以我们需要将Hive的元数据地址改为MySql，可支持多窗口操作。（1）检查当前系统是否安装过Mysql，如果有，则删除[huwei@hadoop101~]$rpm-qa|grepmariadbmariadb-libs-5.5.56-2.el7.x86_64[huwei@h

安装使用 span class token hive hadoop

21 22 232425 26 27