草庐IT

HA集群

全部标签

【Docker】Nacos的单机部署及集群部署

一、Nacos的介绍Nacos是一个更易于构建云原生应用的动态服务发现、配置管理和服务管理平台。动态服务发现:Nacos支持DNS与RPC服务发现,提供原生SDK、OpenAPI等多种服务注册方式和DNS、HTTP与API等多种服务发现方式。服务健康监测:Nacos提供对服务的实时健康检查,阻止向不健康的主机或服务实例发送请求。动态配置服务:Nacos提供配置统一管理功能,能够以中心化、外部化和动态化的方式管理所有环境的应用配置和服务配置。动态DNS服务:Nacos支持动态DNS服务权重路由,能够实现中间层负载均衡、更灵活的路由策略、流量控制以及数据中心内网的简单DNS解析服务。服务及其元数据

RabbitMQ-消息队列:三台虚拟机搭建RabbitMQ集群

22、RabbitMQ集群使用集群的原因​最开始我们介绍了如何安装及运行RabbitMQ服务,不过这些是单机版的,无法满足目前真实应用的要求。如果RabbitMQ服务器遇到内存崩溃、机器掉电或者主板故障等情况,该怎么办?单台RabbitMQ服务器可以满足每秒1000条消息的吞吐量,那么如果应用需要RabbitMQ服务满足每秒10万条消息的吞吐量呢?购买昂贵的服务器来增强单机RabbitMQ务的性能显得捉襟见肘,搭建一个RabbitMQ集群才是解决实际问题的关键.克隆虚拟机搭建步骤1.修改3台机器的主机名称vim/etc/hostname2.配置各个节点的hosts文件,让各个节点都能互相识别对

Springboot对接ceph集群以及java利用s3对象网关接口与ceph集群交互

springboot中引入相关依赖software.amazon.awssdkregions2.22.13software.amazon.awssdkeksauth2.22.13software.amazon.awssdks32.22.12testsoftware.amazon.awssdks32.22.12compile然后java代码,一些相关注意的事项都在代码里有标出。importjava.net.URI;importjava.net.URISyntaxException;importjava.nio.ByteBuffer;importjava.nio.file.Paths;import

25-k8s集群中-RBAC用户角色资源权限

一、RBAC概述1,k8s集群的交互逻辑(简单了解)    我们通过k8s各组件架构,知道各个组件之间是使用https进行数据加密及交互的,那么同理,我们作为“使用”k8s的各种资源的使用者,也是通过https进行数据加密的;    k8s通过我们家目录下的证书来判断我们是谁?通过证书内容来认定我们的权限;用户证书的位置[root@k8s231~]#ll-a.kube/config -rw-------1rootroot5634Jan 119:40.kube/config2,k8s的安全架构(简单了解)3,RBAC用户授权的逻辑(重要)用户/主题Topic    1,User    2,Ser

Gitlab+Jenkins+Docker+Harbor+K8s集群搭建CICD平台(持续集成部署Hexo博客Demo)

目录涉及内容:一、CICD服务器环境搭建1、docker环境安装(1)、拉取镜像,启动并设置开机自启(2)、配置docker加速器2、安装并配置GitLab(1)、创建共享卷目录(2)、创建gitlab容器(3)、关闭容器修改配置文件(4)、修改完配置文件之后。直接启动容器(5)、相关的git命令(针对已存在的文件夹)3、安装配置远程镜像仓库harbor(1)、首先需要设置selinux、防火墙(2)、安装并启动docker并安装docker-compose,关于docker-compose,这里不用了解太多,一个轻量的docker编排工具(3)、解压harbor安装包:harbor-offl

Redis三种模式——主从复制、哨兵模式、集群

目录一、Redis模式二、Redis主从复制2.1主从复制概述2.2主从复制2.3Redis主从复制过程2.4搭建Redis主从复制2.4-1环境部署2.4-2安装Redis2.4-3修改Redis配置文件(Master节点操作)2.4-4修改Redis配置文件(Slave节点操作)2.4-5验证主从效果三、Redis哨兵模式3.1哨兵模式的作用3.2故障转移机制3.3主节点的选举3.4搭建Redis哨兵模式3.4-1验证主从效果修改Redis哨兵模式的配置文件(所有节点操作)3.4-2启动哨兵模式3.4-3查看哨兵信息3.4-4故障模拟四、Redis群集模式4.1集群的作用4.2Redis集

Prometheus跟踪HA环境中的长期运行过程

我正在运行Prometheus来监视我的系统,目前正在应用程序级指标中构建。我遇到的问题是长期运行的过程。我想知道任何时候都在运行多少,而且我似乎找不到Prometheus的好解决方案。这些过程正在从多个冗余应用程序中运行异步,这些应用程序都同时接收流量。这些过程在10分钟至几个小时之间运行,因此我最初的天真方法是在启动过程中计算计数器,并在过程停止时增加另一个计数器。我在这里遇到的问题是,当一个过程在Grafana开始时,我会看到上升rate操作员,但我无法监视任何时间运行多少。由于两个应用程序正在管理同一流程池,因此我无法真正使用量规报告当前运行过程的数量)。(并且将从共享数据库中请求流程

基于 HBase & Phoenix 构建实时数仓(1)—— Hadoop HA 安装部署

目录一、主机规划二、环境准备1.启动NTP时钟同步2.修改hosts文件3.配置所有主机间ssh免密4.修改用户可打开文件数与进程数(可选)三、安装JDK四、安装部署 Zookeeper集群1.解压、配置环境变量2.创建配置文件3.创建新的空ZooKeeper数据目录和事务日志目录4.添加myid配置5.设置Zookeeper使用的JVM堆内存6.启动ZooKeeper7.查看ZooKeeper状态8.简单测试ZooKeeper命令五、安装配置HadoopHA集群1.解压、配置环境变量(node1执行)2.HDFS高可用配置(1)创建存储目录(2)修改核心模块配置(3)修改hdfs文件系统模块

Meta新增两大万卡集群,投入近50000块英伟达H100 GPU

Meta日前推出两个功能强大的GPU集群,用于支持下一代生成式AI模型的训练,包括即将推出的Llama3。据悉,这两个数据中心的GPU数量均高达24,576块,专为支持比之前发布的更大、更复杂的生成式AI模型而构建。作为一种流行的开源算法模型,Meta的Llama能与OpenAI的GPT和Google的Gemini相媲美。Meta刷新AI集群规模 极客网了解到,这两个GPU集群都采用了英伟达当前功能最强大的H100GPU,并且比Meta之前推出的大型集群规模要大得多。此前Meta的集群约有16,000块NvidiaA100GPU。据报道,Meta为此抢购了数千块英伟达最新推出的GPU。调研机构

CentOS 7.9 环境下搭建k8s集群(一主两从)

目录一、硬件准备(虚拟主机)二、环境准备1、所有机器关闭防火墙2、所有机器关闭selinux3、所有机器关闭swap4、所有机器上添加主机名与ip的对应关系5、在所有主机上将桥接的ipv4流量传递到iptables的链三、为所有节点安装docker四、集群部署1、为所有节点修改仓库,安装kubeadm、kubelet、kubectl2、修改docker的配置(所有节点)3、部署master节点(主节点k8s-master)(1)、遇到报错:(2)、解决办法:4、按照指示执行:5、查看kubelet.service状态6、查看节点状态为notready7、安装网络插件,官方文档:https://