草庐IT

AdminManualConfiguration-hive-sit

全部标签

【大数据之Hive】六、Hive之metastore服务部署

  metastore为HiveCLI或Hiveserver2提供元数据访问接口。1metastore运行模式  metastore运行模式有两种,嵌入式模式和独立服务模式。(1)嵌入式模式  将metastore看作一个依赖嵌入到Hiveserver2和每一个HiveCLI客户端进程,使得Hiveserver2和HiveCLI客户端直接连接访问数据库。(2)独立服务模式  把metastore服务独立出来单独启动,Hiveserver2和Hive命令行客户端都访问metastore服务,然后再由metastore访问元数据库。  Metastore不负责存储元数据,只负责提供访问元数据的接口

mysql - 需要从 hive 中的给定时间戳中减去一些小时

输入:unix_timestamp('01/15/201815:26:37','mm/dd/YYYYhh:mm:ss')预期输出比utc输入时间延迟4小时,即01/15/201811:26:37我知道hive中有date_sub函数,但它仅用于从给定时间戳中减去天数。但我需要知道是否有一种方法可以减去小时、分钟或秒。我也尝试过类似下面的方法,因为EDT时区比UTC晚4小时(但输出错误):SELECTto_date(from_UTC_timestamp(unix_timestamp('01/15/201815:26:37','mm/dd/YYYYhh:mm:ss')*1000,'EST6

Hive中怎样创建和查询视图信息?

视图是从数据库的数据表中选取出来的数据组成的逻辑窗口,它是一个虚拟机表。引入视图后,用户可以将注意力集中在关心的数据上,如果数据来源于多个基本表结构,并且搜索条件比较复杂时,需要编写的查询语句就会比较烦琐,此时可以使用视图将数据查询语句变得简单可行。Hive中的视图是一种无关底层存储的逻辑对象,也就是说视图中的数据并不会持久化到HDFS中。视图中的数据是来自SELECT语句查询的结果集,一旦视图创建完成,便不能向视图中插入或者加载数据。本节针对视图的创建和查询视图信息进行讲解。创建视图的语法格式如下:CREATEVIEW[IFNOTEXISTS][db_name.]view_name[(col

大数据之Hive:regexp_extract函数

目录一、正则的通配符简介1、正则表达式的符号及意义2、各种操作符的运算优先级:二、regexp_extract函数一、正则的通配符简介1、正则表达式的符号及意义符号含义实列/做为转意,即通常在"/"后面的字符不按原来意义解释如"*“匹配它前面元字符0次或多次,/a*/将匹配a,aa,aaa,加了”/"后,/a/*/将只匹配"a*".匹配任何一个字符^匹配一个输入或一行的开头/^a/匹配"anA",而不匹配"Ana"$匹配一个输入或一行的结尾/a$/匹配"Ana",而不匹配"anA"*匹配前面元字符0次或多次/ba*/将匹配b,ba,baa,baaa+匹配前面元字符1次或多次/ba+/将匹配ba

【大数据Hive】hive select 语法使用详解

目录一、前言二、Hiveselect完整语法树三、Hiveselect操作演示3.1数据准备3.1.1创建一张表3.1.2将数据load加载到t_usa_covid19表3.1.3再创建一张分区表3.1.4使用动态分区插入数据3.2select常用语法3.2.1查询所有字段或者指定字段3.2.2查询匹配正则表达式的所有字段3.2.3查询当前数据库3.2.4查询使用函数3.2.5使用函数3.3distinct关键字3.3.1查询state字段并去重3.3.2多个字段distinct整体去重3.4分区查询、分区裁剪3.5GROUPBY3.5.1GROUPBY概念3.5.2hive中GROUPBY使

hive的concat()、concat_ws()和collect_list()、collect_set()的用法

hive的concat、concat_ws和collect_list、collect_set的用法concat和concat_wscollect_list和collect_setconcat和concat_wsconcat():函数在连接字符串的时候,只要其中一个是NULL,那么将返回NULL。执行代码:selectconcat('a','b',null);执行结果:NULLconcat_ws():函数在连接字符串的时候,只要有一个字符串不是NULL,就不会返回NULL。concat_ws():函数需要指定分隔符。执行代码1:selectconcat_ws('-','a','b');执行结果:

hive 架构及 metastore 功能简单介绍

这两天在调研用java怎么能通过hivemetastore将hive表中的数据读出来(不能用hive2),最好是能直接支持sql查询。各种查跟尝试,最终确定这条路走不通。期间研究了下hive的内部架构,其实就是看了一遍官方文档。记录下怕忘了。hive中主要有两个组件hiveserver2和hivemetastore,前者负责对外提供DML服务,后者记录了数据的元信息,在sql生成执行计划时为其提供依据。(为什么从metastore中查不了表中的数据,因为人家压根没存)。hive架构这张图是从官网截的。里面展示了主要的组件以及它跟hadoop(spark)的交互。主要组件如下:UI:用户提交查询

mysql - 如何漂亮地打印 Hive 输出

如何让Hive打印出格式良好的结果,包括列名和令人愉快的空格,例如mysql?例如:$hive-fperformanceStatistics.hql...KillCommand=/usr/lib/hadoop/bin/hadoopjob-killjob_201306211023_1053HadoopjobinformationforStage-1:numberofmappers:8;numberofreducers:12013-09-0417:30:56,092Stage-1map=0%,reduce=0%2013-09-0417:31:03,132Stage-1map=25%,red

spark读取hive表字段,区分大小写问题

背景spark任务读取hive表,查询字段为小写,但Hive表字段为大写,无法读取数据问题错误:如何解决呢?Inversion2.3andearlier,whenreadingfromaParquetdatasourcetable,SparkalwaysreturnsnullforanycolumnwhosecolumnnamesinHivemetastoreschemaandParquetschemaareindifferentlettercases,nomatterwhether spark.sql.caseSensitive issetto true or false.Since2.4,

大数据学习(6)-hive底层原理Mapreduce

&&大数据学习&&🔥系列专栏:👑哲学语录:承认自己的无知,乃是开启智慧的大门💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博>主哦🤞MapReduce是一个分布式运算程序的编程框架,核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。MapReduce的工作流程分为两个阶段:Map阶段和Reduce阶段。在Map阶段,MapTask并行度决定机制根据InputFormat数据切片机制对输入数据进行切片,将切片分配给不同的Map任务。每个Map任务对输入数据进行处理,生成一系列的键值对()。在Reduce阶段,不同