本文介绍在国产化操作系统和服务器上进行ceph集群的安装。基础配置操作系统使用银河kylinv10,CPU为飞腾处理器S2500。[root@node1~]#cat/etc/kylin-releaseKylinLinuxAdvancedServerreleaseV10(Sword)[root@node1~]#lscpu架构:aarch64CPU运行模式:64-bit字节序:LittleEndianCPU:128在线CPU列表:0-127每个核的线程数:1每个座的核数:64座:2NUMA节点:16厂商ID:Phytium型号:3型号名称:Phytium,S2500/64C00步进:0x1CPU最
计算机网络把各地的计算机连接了起来,只要有一台可以上网的终端,比如手机、电脑,就可以访问互联网上任何一台服务器的资源(包括静态资源和动态的服务)。作为开发者的我们,就是这些资源、服务的提供者,把资源上传到服务器,并把服务跑起来的过程就叫做部署。代码部分的部署,需要先经过构建,也就是编译打包的过程,把产物传到服务器。最原始的部署方式就是在本地进行build,然后把产物通过FTP或者scp(基于SSH的远程拷贝文件拷贝)传到服务器上,如果是后端代码还需要重启下服务。每个人单独构建上传,这样不好管理,也容易冲突,所以现在都会用专门的平台来做这件事构建和部署,比如jenkins。我们代码会提交到git
背景对很多人来说,未知、不确定、不在掌控的东西,会有潜意识的逃避。当我第一次接触Prometheus的时候也有类似的感觉。对初学者来说,Prometheus包含的概念太多了,门槛也太高了。概念:Instance、Job、Metric、MetricName、MetricLabel、MetricValue、MetricType(Counter、Gauge、Histogram、Summary)、DataType(InstantVector、RangeVector、Scalar、String)、Operator、Function马老师说:“虽然阿里巴巴是全球最大的零售平台,但阿里不是零售公司,是一家数
ApacheTomcat是一个开源Web服务器和servlet容器,用于部署和服务JavaWeb应用程序。大多数现代JavaWeb框架都基于servlet,例如JavaServerFaces、Struts、Spring等。ApacheTomcat还默认在8080端口上提供了一个HTTP连接器,即Tomcat也可以用作HTTP服务器。但是Tomcat的性能不如ApacheHTTP服务器等指定Web服务器的性能。在大多数生产中,Tomcat与ApacheHTTPServer结合使用,其中ApacheHTTPServer处理html、图像等静态内容,并将对动态内容的请求转发给Tomcat。本安装和配
就在不久前我也遇到了类似的问题,看似是玄学事件,刚开始归结于网络链路抖动,一段时间后依然存在,虽然影响都是P99.99以后的数据,但是扰人心智,最后通过多方面定位,解决了该问题。最后发现跟业务、网络都没有什么关系,而是基础设施自身出了问题,如下文给了一个具体排查方案,并从一定程度上解释了容器、cgroup、CPU会给网络延迟带来怎样的影响。随着Kubernetes集群规模不断增长,我们对于服务延迟的要求越来越严苛。我们开始观察到一些运行在我们Kubernetes平台上的服务正在面临偶发的延迟问题,这些断断续续的问题并不是由于应用本身的性能问题导致的。我们发现,Kubernetes集群上的应用产
Zabbix作为一款传统的监控软件一直保持稳定的迭代,到目前为止稳定版已经更新到5.4了。Zabbix内置非常多现成的监控项,从操作系统到常用的软件Redis、MySQL等,几乎都可以找到对应的监控项,差不多可以做到零配置就实现操作系统三大件:CPU、硬盘、内存的监控。此外Linux和Windows,Zabbix都支持。Zabbix内置丰富的告警媒介,但很遗憾没有内置企业微信告警。企业微信在很多公司都有使用,得益于它强大的消息推送API,我们可以自己实现使用企业微信作为告警媒介,本文就从零开始介绍如何使用企业微信发送Zabbix告警。一、企业微信配置相关浏览器登录企业微信管理后台,在“应用管理
什么是Redis持久化?Redis作为一个键值对内存数据库(NoSQL),数据都存储在内存当中,在处理客户端请求时,所有操作都在内存当中进行,如下所示:这样做有什么问题呢?其实,只要稍微有点计算机基础知识的人都知道,存储在内存当中的数据,只要服务器关机(各种原因引起的),内存中的数据就会消失了,不仅服务器关机会造成数据消失,Redis服务器守护进程退出,内存中的数据也一样会消失。对于只把Redis当缓存来用的项目来说,数据消失或许问题不大,重新从数据源把数据加载进来就可以了,但如果直接把用户提交的业务数据存储在Redis当中,把Redis作为数据库来使用,在其放存储重要业务数据,那么Redis
本文主要介绍ceph16版本集群节点系统磁盘故障后的集群恢复,虽然系统盘很多都是做了raid1,但从实际做的项目看,总是有很多未知意外发生,节点挂掉后,上面的mon和osd,mgr都会down掉,如果所在节点的mgr服务是激活状态,则其他节点所在的备用节点将会升级为激活状态。移除问题主机节点挂掉后,在确定不能继续开机进入系统的情况下,需要在其他正常的节点将故障节点进行移除,此次宕机的节点为node4,以下命令可能会导致数据丢失,因为osd将通过调用每个osd来强制从集群中清除。cephorchhostrmnode4--offline--force节点初始化操作将node4节点即故障节点更换新的
本文主要针对Zabbix5.0LTS如何升级到6.0LTS做一个探讨。正文本文环境注意本文环境,有可能与您的环境有所出入,所以问题有可能不同!CentOS7.9.2009Mariadb10.3ZabbixLTS5.0.20虚拟机环境为VMwareZabbix5.0.20升级思路系统升级–>数据库升级–>ZabbixServer升级停止相关服务systemctlstopzabbix-serverzabbix-agentrh-nginx116-nginxrh-php72-php-fpmmariadb准备工作安装epel源、yum-utils工具yum-yinstallepel-releaseyum
1、故障现象我们一个agent代理服务,发布到k8s集群之后,pod状态是Running,但是server一直无法收到心跳信号,因此到集群内部去排查日志,发现该服务日志中出现大量的连接某一个ip地址tcptimeout2、故障排查过程通过查看日志发现是大量的错误日志,连接某个ip地址产生i/otimeout,因此排查服务的业务逻辑,该服务只会去连接server端,在服务的环境变量里配置了server端的域名,怀疑是不是有可能server端挂掉,在本地和集群宿主机上调用server的地址,发现是可以通的,因此排除掉了server端本身的问题因为server端连接地址在我本地和集群宿主机上是可以正