草庐IT

Spark On Hive原理和配置

目录一、SparkOnHive原理    (1)为什么要让SparkOnHive?二、MySQL安装配置(root用户)    (1)安装MySQL    (2)启动MySQL设置开机启动    (3)修改MySQL密码三、Hive安装配置    (1)修改Hadoop的core-site.xml    (2)创建hive-site.xml    (3)修改配置文件hive-env.sh    (4)上传mysql连接驱动    (5)初始化元数据(Hadoop集群启动后)        (6)创建logs目录,启动元数据服务    (7)启动Hiveshell四、SparkOnHive配置 

hive 配置metastore hiveserver2服务开启

安装mysqlcreatedatabasemetastore;配置hivehive-site.xml:javax.jdo.option.ConnectionURLjdbc:mysql://hadoop102:3306/metastore?useSSL=falsejavax.jdo.option.ConnectionDriverNamecom.mysql.jdbc.Driverjavax.jdo.option.ConnectionUserNamerootjavax.jdo.option.ConnectionPassword123456hive.metastore.warehouse.dir/us

Hive ACID笔记

环境:hive3.1.0执行引擎:hiveontez什么是hiveACID?hive官网对于ACID的介绍:https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions中文文档关于ACID的介绍:https://www.docs4dev.com/docs/zh/apache-hive/3.1.1/reference/Hive_Transactions.html其实和传统数据库中所说的ACID有异曲同工之妙:原子性(Atomicity)原子性是指事务是一个不可分割的工作单位,事务中的操作要么全部成功,要么全部失败。一致性(C

Hive行转列[一行拆分成多行/一列拆分成多列]

场景:hive有张表armmttxn_tmp,其中有一个字段lot_number,该字段以逗号分隔开多个值,每个值又以冒号来分割料号和数量,如:A3220089:-40,A3220090:-40,A3220091:-40,A3220083:-40,A3220087:-40,A3220086:-40,A3220088:-40,A3220084:-40,A3220081:-40,A3220082:-40,A3220092:-40,A3220093:-40,A3220085:-40,A3220094:-40。要求:把该字段拆分开来,并且把料号和数量单独列出,也就是分成两列。原数据:selectkey

Hive中处理中文乱码问题的解决方法

中文乱码是在处理大数据时经常遇到的问题之一,尤其是在使用Hive进行数据分析和查询时。本文将介绍一些解决Hive中文乱码问题的方法,并提供相应的源代码示例。设置Hive的字符集编码在Hive中,可以通过设置字符集编码来解决中文乱码问题。通过在Hive会话中设置"client.encoding"和"client.charset"参数,可以指定Hive会话的字符集编码为UTF-8,如下所示:SETclient.encoding=UTF-8;SETclient.charset=UTF-8;这样设置之后,Hive会将输入和输出的数据都以UTF-8编码进行处理,从而避免中文乱码问题。创建Hive表时指定

Hive 的安装与配置

一.安装前部署安装前首先保证Hadoop环境能够正常运行。1.下载准备1.1下载hive安装包Indexof/dist/hive我下载的是hive3.1.31.2下载MySQL安装包MySQL::DownloadMySQLCommunityServer  如果用的是centOS7,就照着我这么选就可以1.3下载mysql-connector-javajar包如果jdk是1.8的下载5.1.x以上的mysql-connector-java,不同版本的自己去查版本适配,避免冲突我这里用的是mysql8.0.31,hive3.1.3,mysql-connector-java-5.1.49下载地址:链

Hive权限管理

Hive权限管理1、hive授权模型介绍(1)StorageBasedAuthorizationintheMetastoreServer基于存储的授权-可以对Metastore中的元数据进行保护,但是没有提供更加细粒度的访问控制(例如:列级别、行级别)。(2)SQLStandardsBasedAuthorizationinHiveServer2基于SQL标准的Hive授权-完全兼容SQL的授权模型,推荐使用该模式。(3)DefaultHiveAuthorization(LegacyMode)hive默认授权-设计目的仅仅只是为了防止用户产生误操作,而不是防止恶意用户访问未经授权的数据。2、基于

HIve中的查询语句

文章目录Hive中的查询语句1.基础语法2.基本查询(Select…From)2.1数据准备(0)原始数据(1)创建部门表(2)创建员工表(3)导入数据2.2全表和特定列查询1)全表查询2)选择特定列查询2.3列别名1)为什么要给列起别名?2)如何给列其别名?3)案例实操2.4Limit语句2.5Where语句2.6关系运算函数2.7逻辑运算函数1)基本语法(and/or/not)2)案例实操2.8聚合函数1)语法2)案例实操3分组3.1GroupBy语句3.2Having语句1)having与where不同点2)案例实操4Join语句4.1等值Join4.2表的别名1)好处2)案例实操4.3

2023.12.14 hive sql的聚合增强函数 grouping set

 目录 1.建库建表 2.需求 3.使用unionall来完成需求 4.聚合函数增强groupingset 5.聚合增强函数cube,rollup 6.rollup翻滚7.聚合函数增强--grouping判断1.建库建表--建库createdatabaseifnotexiststest;usetest;--建表createtabletest.t_cookie(monthstring,daystring,cookieidstring)rowformatdelimitedfieldsterminatedby',';--数据样例内容insertintotest.t_cookievalues('201

运行hive语句时有很多info怎么消掉

1.提出问题 每次启动hive和执行hivesql命令时都打印了很多没用的INFO日志,看起来很繁琐,那么该怎么消除掉这些没用的日志消息问题展示: 2.解决方法    进入hive的安装目录下:/opt/module/hive/conf/创建log4j.properties日志的配置文件:cd/opt/module/hive-3.1.3/confvilog4j.properties     进入文件log4j.properties后按i进入编辑模式,然后写入以下信息: log4j.rootLogger=WARN,CAlog4j.appender.CA=org.apache.log4j.Cons