草庐IT

HA集群

全部标签

Kubernetes(k8s)集群部署----->超详细

Kubernetes(k8s)集群部署----->超详细一、资源准备二、安装准备2.1主机环境设置2.1.1关闭操作系统防火墙、selinux2.1.2关闭swap交换分区2.1.3允许iptables检测桥接流量(可选)2.2安装Docker环境2.3安装Kubeadm、Kubelet和Kubectl2.3.1配置k8s的yum源(阿里云的源)2.3.2安装及版本检查2.3.3设置kubelet自启动2.3.4卸载三、Kubernetes集群所需的镜像拉取3.1生成一个默认kubeadm初始化配置文件3.2列出当前Kubernetes集群所需的所有镜像列表及其版本信息3.3拉取所k8s需要的

管理 Kubernetes 集群这3年,我踩过的十个坑

作者 | HerveKhg编译 |如烟出品|51CTO技术栈(微信号:blog51cto)Kubernetes作为云计算领域的绝对主角,当仁不让地坐上了容器技术领域的“头把交椅”。它的精髓在于,你只要在YAML里描述清楚应用的样子,剩下的一切都可以交给它来完成。但这一切的前提是 K8s 集群的高效管理。说起我管理Kubernetes集群这三年,真可谓是一波三折、跌宕起伏。在这段充满挑战的经历中,我对这项技术有了更加深刻的了解,总结出十条我认为最有价值的经验教训,涵盖的内容包括管理底层基础设施、优化部署流程、确保集群的可扩展性和安全性的最佳实践。无论你是刚入门Kubernetes的新手,还是经验

阿里云主机安装RocketMQ 集群支持外网访问

背景:因公司迁移机房,需要在云主机上部署一套和本地一样的rocketMQ,原本计划直接购买云rocketMQ,云rocketMQ仅支持5.0.0,本地rocketMQ是3.4.6,公司多个服务都使用本地的3.4.6版本的RocketMQ,所以需要再云上搭建一套简易版RocketMQ集群,并支持外网访问。准备:两台开通外网的云主机,带宽100M,16G内存,500G硬盘,两台成本1000+      设置主机名,安装jdk,配置免密等等,前期的准备工作。      安装包:rocketmq-3.4.6.tar.gz      下载地址:因为是只有两台,所以规划是2m-noslavevi /opt

【运维】hive 高可用详解: Hive MetaStore HA、hive server HA原理详解;hive高可用实现

文章目录一.hive高可用原理说明1.HiveMetaStoreHA2.hiveserverHA二.hive高可用实现1.配置2.beeline链接测试3.zookeeper相关操作一.hive高可用原理说明1.HiveMetaStoreHAHive元数据存储在MetaStore中,包括表的定义、分区、表的属性等信息。hivemetastore配置多台,可以避免单节点故障导致整个集群的hiveclient不可用。原理如下:Active-activemodeisnotsupportedforHiveMetastore.Hence,thereisoneactiveinstanceoftheHive

docker容器搭建MySQL集群,mysql主从同步

一:MySQL集群介绍1.1MySQL集群的目标•高可用(HighAvailability),是当一台服务器停止服务后,对于业务及用户毫无影响。停止服务的原因可能由于网卡、路由器、机房、CPU负载过高、内存溢出、自然灾害等不可预期的原因导致,在很多时候也称单点问题。•突破数据量限制,一台服务器不能储存大量数据,需要多台分担,每个存储一部分,共同存储完整个集群数据。最好能做到互相备份,即使单节点故障,也能在其他节点找到数据。•数据备份容灾,单点故障后,存储的数据仍然可以在别的地方拉起。•压力分担,由于多个服务器都能完成各自一部分工作,所以尽量的避免了单点压力的存在1.2MySQL集群的基础形式1

通过containerd部署k8s集群环境及初始化时部分报错解决

目录一.基础环境配置(每个节点都做)1.hosts解析2.防火墙和selinux3.安装基本软件并配置时间同步4.禁用swap分区5.更改内核参数6.配置ipvs7.k8s下载(1)配置镜像下载相关软件(2)配置kubelet上的cgroup二.下载containerd(每个节点都做)1.下载基本软件2.添加软件仓库信息3.更改docker-ce.repo文件4.下载containerd并初始化配置5.更改containerd上的cgroup6.修改镜像源为阿里7.配置crictl并拉取镜像验证三.master节点初始化(只在master做)1.生成并修改配置文件2.查看/etc/contai

springboot集成flink并发布flink集群端运行

背景:近期项目需要,引入flink,研究了下flink,步步踩坑终于可以单独运行,也可发布到集群运行,记录下踩坑点。开发环境:idea+springboot(2.3.5.RELEASSE)+kafka(2.8.1)+mysql(8.0.26)。废话不多说,直接上可执行代码。以下代码实现了某个时间间隔,设备不上传数据,判断为离线的逻辑一、项目application创建/***flink任务提交application**@authorwangfenglei*/@SpringBootApplication(scanBasePackages={"com.wfl.firefighting.flink",

Docker部署Nacos集群并用nginx反向代理负载均衡

首先找到Nacos官网给的Github仓库,里面有dockercompose可以快速启动Nacos集群。文章目录一.脚本概况二.自定义修改1.`example/cluster-hostname.yaml`2.`example/.env`3.`env/mysql.env`4.`env/nacos-hostname.env`三、运行四、nginx反向代理,负载均衡1.配置文件修改2.运行一.脚本概况我们要运行的脚本是example/cluster-hostname.yaml,可以看到里面包含了来自外界的${NACOS_VERSION}和加载外界env文件的env_file条目,于是我们可以找到本y

K8S集群中Node节点资源不足导致Pod无法运行的故障排查思路

K8S集群中Node节点资源不足导致Pod无法运行的故障排查思路Node节点资源不足可能会产生的故障故障一:Pod数量太多超出物理节点的限制每一台Node节点中默认限制最多运行110个Pod资源,当一个应用程序有成百上千的Pod资源时,如果不扩容Node节点或者修改最大Pod数量限制,那么就会导致部分Pod资源无法正常运行,因为节点已经没有资源可以被调度了。解决思路就是扩容Node节点数量或者修改Pod的数量限制故障二:Pod配置的资源限额超出物理节点的最大使用率由于Node节点资源有限,当Pod设置的资源配额超出了Node节点所承受的极限,那么Pod将无法部署和运行,会报错没有合适的Node

hadoop集群配置与启动(三)

1集群部署规划NameNode和SecondaryNameNode不要安装在同一台服务器。(它们两个都需要耗内存,分开减少集群的压力)ResourceManager也很消耗内存,不要和NameNode、SecondaryNameNode配置在同一台机器上2配置文件说明Hadoop配置文件分两类:默认配置文件和自定义配置文件,只有用户想修改某一默认配置值时,才需要修改自定义配置文件,更改相应属性值。(1)默认配置文件:(2)自定义配置文件:core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml四个配置文件存放在$HADOOP_HOME/