草庐IT

k8s单机集群

全部标签

云计算项目十:ES集群安装|部署kibana

ES集群安装部署ES集群,用于ELK日志分析平台的构建es-0001主机更改/etc/hosts[root@es-0001~]#vim/etc/hosts192.168.1.71es-0001192.168.1.72es-0002192.168.1.73es-0003192.168.1.74kibana192.168.1.75logstash#将最新的/etc/hosts配置文件更新到所有的云主机上[root@es-0001~]#foriin192.168.1.{72..75};doscp/etc/hosts$i:etc;done#在跳板机ecs-proxy将ELK相关软件包做好yum仓库,若

k8s查看多个pod日志问题研究

痛点在接触k8s一段时间以后.有个问题一直困扰着我.线上日志是用graylog工具聚合的.但是存在延时15分钟的问题.为了提高效率.想直接用kubectl命令行查看pod的日志.然而线上分灰度与正式环境且一个服务会有多个pod实例运行.那么请求进来了应该查看哪个pod的日志呢?思考过程1.查看单个pod日志查看一个pod日志的方法我知道:kubectllogs[-f][-nnamspace]pod还有一种方式是进入pod后查看应用内部的日志:kubectlexec-it[-nnamespace]podbash2.查看多个pod的日志那么,如果想查看多个pod中的日志呢?google一番,找到了

Ceph集群部署

目录一、环境准备1、准备4台centos服务器2、配置ceph源3、配置主机名解析和SSH互信4、NTP时间同步二、ceph集群部署1、安装ceph组件2、部署MON集群3、部署OSD集群一、环境准备1、准备4台centos服务器主机主机名IP备注客户端client192.168.2.10关闭selinux和firewalldOSD+MONnode1192.168.2.20关闭selinux和firewalld添加2块磁盘,sdb和sdcOSD+MONnode2192.168.2.30关闭selinux和firewalld添加2块磁盘,sdb和sdcOSD+MONnode3192.168.2.

13-k8s的控制器资源-rc控制器replicationcontrollers

一、rc控制器资源的概述    replicationcontrollers控制器资源,简称:rc控制器;    简单理解,rc控制器就是控制相同的pod副本数量;    使用rc控制器资源创建pod,就可以设定创建pod的数量;二、rc控制器资源管理1,编辑rc资源清单[root@k8s231rc]#vimrc.yamlapiVersion:v1kind:ReplicationControllermetadata: name:rc01spec: #控制pod的副本数量 replicas:5 #选择要创建副本的pod的标签(关联pod标签,把谁的副本设置成5个呀?) selector:  k8

Kubernetes 集群节点处于 Not Ready 问题排查

背景Kubernetes是一个强大的平台,用于自动化部署、扩展和操作容器中的应用程序。有时,您可能会遇到节点处于非就绪状态(“NotReady”)。本文将指导您逐步解决这些问题。当Kubernetes中的一个节点处于不可用状态时,需要立即排查。可以按照以下步骤来确定根本原因。检查节点的状态首先,您需要确认节点确实处于“未就绪”状态。使用以下命令列出所有节点的状态:kubectlgetnodes您将看到类似于这样的输出:NAMESTATUSROLESAGEVERSIONnode-1Ready30dv1.25.1node-2NotReady25dv1.25.1node-3Ready28dv1.25

4万亿晶体管5nm制程,全球最快AI芯片碾压H100!单机可训24万亿参数LLM,Llama 70B一天搞定

全球最快、最强的AI芯片面世,让整个行业瞬间惊掉了下巴!就在刚刚,AI芯片初创公司Cerebras重磅发布了「第三代晶圆级引擎」(WSE-3)。性能上,WSE-3是上一代WSE-2的两倍,且功耗依旧保持不变。90万个AI核心,44GB的片上SRAM存储,让WSE-3的峰值性能达到了125FP16PetaFLOPS。这相当于52块英伟达H100GPU!不仅如此,相比于800亿个晶体管,芯片面积为814平方毫米的英伟达H100。采用台积电5nm制程的WSE-3,不仅搭载了40000亿个晶体管(50倍),芯片面积更是高达46225平方毫米(57倍)。专为AI打造的计算能力此前,在传统的GPU集群上,

Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI

每年3月份,照例各家大厂又要开始秀自己最新的产品和研究了。OpenAI刚刚发布了震惊世人的Sora,最新的ChatGPT版本似乎也是箭在弦上。谷歌更是举全公司之力,从去年底就开始放出了包括GeminiUltra,Gemini1.5,Gemma在内,各分支赛道上的惊艳成果。可是作为开源AI的扛把子,Meta在去年发布了Llama2和后续的模型后,就一直缺少有影响力的产品问世。而对于开源社区来说,OpenAI虽好,可Meta才是大家真的衣食父母。大家都在翘首以待Llama3的发布。在Llama3公开之前,不甘寂寞的Meta还是想到办法在行业内刷了一波存在感——秀肌肉。MetaAI刚刚发表了一份技术

【Docker】Nacos的单机部署及集群部署

一、Nacos的介绍Nacos是一个更易于构建云原生应用的动态服务发现、配置管理和服务管理平台。动态服务发现:Nacos支持DNS与RPC服务发现,提供原生SDK、OpenAPI等多种服务注册方式和DNS、HTTP与API等多种服务发现方式。服务健康监测:Nacos提供对服务的实时健康检查,阻止向不健康的主机或服务实例发送请求。动态配置服务:Nacos提供配置统一管理功能,能够以中心化、外部化和动态化的方式管理所有环境的应用配置和服务配置。动态DNS服务:Nacos支持动态DNS服务权重路由,能够实现中间层负载均衡、更灵活的路由策略、流量控制以及数据中心内网的简单DNS解析服务。服务及其元数据

RabbitMQ-消息队列:三台虚拟机搭建RabbitMQ集群

22、RabbitMQ集群使用集群的原因​最开始我们介绍了如何安装及运行RabbitMQ服务,不过这些是单机版的,无法满足目前真实应用的要求。如果RabbitMQ服务器遇到内存崩溃、机器掉电或者主板故障等情况,该怎么办?单台RabbitMQ服务器可以满足每秒1000条消息的吞吐量,那么如果应用需要RabbitMQ服务满足每秒10万条消息的吞吐量呢?购买昂贵的服务器来增强单机RabbitMQ务的性能显得捉襟见肘,搭建一个RabbitMQ集群才是解决实际问题的关键.克隆虚拟机搭建步骤1.修改3台机器的主机名称vim/etc/hostname2.配置各个节点的hosts文件,让各个节点都能互相识别对

Springboot对接ceph集群以及java利用s3对象网关接口与ceph集群交互

springboot中引入相关依赖software.amazon.awssdkregions2.22.13software.amazon.awssdkeksauth2.22.13software.amazon.awssdks32.22.12testsoftware.amazon.awssdks32.22.12compile然后java代码,一些相关注意的事项都在代码里有标出。importjava.net.URI;importjava.net.URISyntaxException;importjava.nio.ByteBuffer;importjava.nio.file.Paths;import