草庐IT

大数据Hadoop集群之超级详细的Hive安装配置

大数据Hadoop集群之Hive安装配置目录大数据Hadoop集群之Hive安装配置1.导入Hive压缩包并查看2.解压至module3.配置环境变量4.配置HIVE文件4.1配置hive-env.sh4.2查看版本4.3配置hive-site.xml5.安装mysql6.初始化mysql7.重启mysql8.在mysql中创建存放元数据的数据库9.修改存放hive元数据的数据库字符集为latin110.下载MySQL插件11.更新Hadoop中的jline文件12.格式化mysql服务13.在hdfs创建hive存储目录(如存在则不用操作)14.hive启动时java.net.Connect

大数据Hadoop集群之超级详细的Hive安装配置

大数据Hadoop集群之Hive安装配置目录大数据Hadoop集群之Hive安装配置1.导入Hive压缩包并查看2.解压至module3.配置环境变量4.配置HIVE文件4.1配置hive-env.sh4.2查看版本4.3配置hive-site.xml5.安装mysql6.初始化mysql7.重启mysql8.在mysql中创建存放元数据的数据库9.修改存放hive元数据的数据库字符集为latin110.下载MySQL插件11.更新Hadoop中的jline文件12.格式化mysql服务13.在hdfs创建hive存储目录(如存在则不用操作)14.hive启动时java.net.Connect

hive on spark配置和需要注意的点

1,首先是环境一定要统一,我首先说一下我的环境Hive3.1.2(并且是对于spark3.00来说是编译好的),spark的2个压缩包分别为spark-3.0.0-bin-hadoop3.2.tgz,spark-3.0.0-bin-without-hadoop.tgz上面的2个spark一定要确定版本,如果hive编译的spark的3.1.1版本一定要用spark3.1.1的2个压缩包2.上面环境弄好后就是解压spark的第一个压缩包,然后配置环境变量,注意只要配置环境变量就好,其它的配置可以不用去弄,我把以前的spark的环境变量注释了,采用新的 3,如果上面的做好了,就可以解压缩另一个sp

hive on spark配置和需要注意的点

1,首先是环境一定要统一,我首先说一下我的环境Hive3.1.2(并且是对于spark3.00来说是编译好的),spark的2个压缩包分别为spark-3.0.0-bin-hadoop3.2.tgz,spark-3.0.0-bin-without-hadoop.tgz上面的2个spark一定要确定版本,如果hive编译的spark的3.1.1版本一定要用spark3.1.1的2个压缩包2.上面环境弄好后就是解压spark的第一个压缩包,然后配置环境变量,注意只要配置环境变量就好,其它的配置可以不用去弄,我把以前的spark的环境变量注释了,采用新的 3,如果上面的做好了,就可以解压缩另一个sp

Hive启动报错:Caused by: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server......

hive启动的过程中报错:Caused by:org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.SafeModeException):Cannotcreatedirectory/export/servers/hive/tmp/root/3f53533f-2d07-4ca2-8580-95cb5434e9e3.Namenodeisinsafemode.是因为hive进入了安全模式,可以输入下面代码正常退出安全模式:hdfsdfsadmin-safemodeleave如果显示Safemodeis

Hive启动报错:Caused by: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server......

hive启动的过程中报错:Caused by:org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.SafeModeException):Cannotcreatedirectory/export/servers/hive/tmp/root/3f53533f-2d07-4ca2-8580-95cb5434e9e3.Namenodeisinsafemode.是因为hive进入了安全模式,可以输入下面代码正常退出安全模式:hdfsdfsadmin-safemodeleave如果显示Safemodeis

Hadoop之hdfs操作

HDFS的常见Shell操作直接在命令行中输入hdfsdfs,可以查看dfs后面可以跟的所有参数注意:这里面的[]表示是可选项,表示是必填项[root@bigdata01hadoop-3.3.2]#hdfsdfsUsage:hadoopfs[genericoptions][-appendToFile...][-cat[-ignoreCrc]...][-checksum[-v]...][-chgrp[-R]GROUPPATH...][-chmod[-R]PATH...][-chown[-R][OWNER][:[GROUP]]PATH...][-concat...][-copyFromLocal[

【排错/运维】修复HDFS丢失、损坏以及副本数的问题

文章目录一.问题描述二.问题分析与解决1.HDFS块损坏1.1.问题表述1.2.问题解决直接删除文件的情况需要文件恢复的情况2.副本同步问题2.1.问题表述2.2.问题解决一.问题描述搭建了一个Hadoop的demo环境,用于一些功能测试,使用了一段时间之后发现flink任务提交不到hadoop上了。查看资源也都充足,查看hdfs后发现文件出现丢失和损坏的情况。此文章用于解决hdfs文件的问题。 二.问题分析与解决1.HDFS块损坏1.1.问题表述执行命令:hdfsfsck/发现文件存在丢失和损坏的情况...../dodb/datalake/jars/110/e24d18b0014183c95

基于HDFS实现的简易云盘系统

文章目录前言一、实验简介二、分析与设计1.功能需求分析:2.系统设计三、效果展示四、环境配置五、功能实现1.基础部分2.用户管理3.文件管理六、项目资源七、其他八、参考文件前言基于HDFS的云盘系统实现了云盘的基本数据存储和访问功能。此为大二下大数据平台与架构的综合实验内容,本文旨在记录过程和问题,固然存在很多不合理的地方。一、实验简介云盘系统通过互联网为企业和个人提供信息的存储、读取、下载等服务。具有安全稳定、海量等特点。目前,云盘系统逐步走向成熟,特别是公有云盘能够向用户提供免费存储,,离线下载,文件智能分类等功能。随着互联网的不断普及,用户存储在云盘上的数据量越来越大,数据类型页越来越多

三台异构服务器搭建hadoop HA集群史上最详细方案(HDFS+YARN)

 一、系统基础服务配置主机名IP操作系统CPU内存磁盘Hive0110.86.102.104Centos7.9.2009Xeon4208X16192G46THive0210.86.102.102Centos7.9.2009Xeon4208X16192G46THive0310.86.102.105Centos7.9.2009Xeon8260X48256G    11T最终组成的是一个双副本56T的集群,设置YARN内存共400GB(可调)3台服务器安装CentOSLinuxrelease7.9操作系统,系统盘采用两个小容量的SSD组raid1(分区默认),数据盘使用整体raid5方式组成(rai