草庐IT

“喜提”一个P2级故障—CMSGC太频繁,你知道这是什么鬼?

大家好,我是陶朱公Boy。背景今天跟大家分享一个前几天在线上碰到的一个GC故障— "CMSGC太频繁"。不知道大家看到这条告警内容后,是什么感触?我当时是一脸懵逼的,一万个为什么萦绕心头。什么是CmsGc?CmsGc太频繁又是什么意思?什么情况下会触发CMSGC太频繁这种告警?要怎么样去找到那个被频繁创建的对象?最后又需要怎么规避?接下来这篇文章我会来回答一下:什么是CMSGC太频繁;整个排查过程与你分享;最后我们一起探讨一下一些规避手段。什么是CMSGC太频繁首先我觉得还是有必要解释清楚什么是CMSGC太频繁这个术语,相信不少小伙伴也是比较关心的。如果你听过垃圾搜集器中有一款名为CMS垃圾搜

“喜提”一个P2级故障—CMSGC太频繁,你知道这是什么鬼?

大家好,我是陶朱公Boy。背景今天跟大家分享一个前几天在线上碰到的一个GC故障— "CMSGC太频繁"。不知道大家看到这条告警内容后,是什么感触?我当时是一脸懵逼的,一万个为什么萦绕心头。什么是CmsGc?CmsGc太频繁又是什么意思?什么情况下会触发CMSGC太频繁这种告警?要怎么样去找到那个被频繁创建的对象?最后又需要怎么规避?接下来这篇文章我会来回答一下:什么是CMSGC太频繁;整个排查过程与你分享;最后我们一起探讨一下一些规避手段。什么是CMSGC太频繁首先我觉得还是有必要解释清楚什么是CMSGC太频繁这个术语,相信不少小伙伴也是比较关心的。如果你听过垃圾搜集器中有一款名为CMS垃圾搜

服务器内存故障预测居然可以这样做!

作者:vivo互联网服务器团队- HaoChan随着互联网业务的快速发展,基础设施的可用性也越来越受到业界的关注。内存发生故障的故障率高、频次多、影响大,这些对于上层业务而言都是不能接受的。本文主要介绍EDAC(ErrorDetectionAndCorrection)框架在内存预测方面的应用。首先介绍了EDAC应用的背景,接着是EDAC的原理介绍,然后通过EDAC安装——配置——测试过程详细地介绍了EDAC在vivo服务器上的应用,最后提出了内存预测使用EDAC的方案总结以及服务器RAS(Reliability,AvailabilityandServiceability)应用减小硬件故障对系统

服务器内存故障预测居然可以这样做!

作者:vivo互联网服务器团队- HaoChan随着互联网业务的快速发展,基础设施的可用性也越来越受到业界的关注。内存发生故障的故障率高、频次多、影响大,这些对于上层业务而言都是不能接受的。本文主要介绍EDAC(ErrorDetectionAndCorrection)框架在内存预测方面的应用。首先介绍了EDAC应用的背景,接着是EDAC的原理介绍,然后通过EDAC安装——配置——测试过程详细地介绍了EDAC在vivo服务器上的应用,最后提出了内存预测使用EDAC的方案总结以及服务器RAS(Reliability,AvailabilityandServiceability)应用减小硬件故障对系统

JVM虚拟机性能监控与故障处理工具(3)

1.概述  经过前面两章对于虚拟机内存分配与回收技术各方面的介绍,相信读者已经建立了一个比较完整的理论基础。理论总是作为指导实践的工具,能把这些知识投入到实际工作中才是我们的最终目的。接下来的两章,我们将从实践的角度去了解虚拟机内存管理的世界。  给一个系统定位问题的时候,知识、经验是关键基础,数据是依据,工具是运用知识处理数据的手段。这里说的数据包括:运行日志、异常堆栈、GC日志、线程快照(threaddump/javacore文件)、堆转储快照(heapdump/hprof文件)等。经常使用适当的虚拟机监控和分析的工具可以加快我们分析数据和定位解决问题的速度,但我们在学习工具前,也应当意识

JVM虚拟机性能监控与故障处理工具(3)

1.概述  经过前面两章对于虚拟机内存分配与回收技术各方面的介绍,相信读者已经建立了一个比较完整的理论基础。理论总是作为指导实践的工具,能把这些知识投入到实际工作中才是我们的最终目的。接下来的两章,我们将从实践的角度去了解虚拟机内存管理的世界。  给一个系统定位问题的时候,知识、经验是关键基础,数据是依据,工具是运用知识处理数据的手段。这里说的数据包括:运行日志、异常堆栈、GC日志、线程快照(threaddump/javacore文件)、堆转储快照(heapdump/hprof文件)等。经常使用适当的虚拟机监控和分析的工具可以加快我们分析数据和定位解决问题的速度,但我们在学习工具前,也应当意识

【Kubernetes】 故障转移和自愈能力机制详解

文章目录一.引言1.介绍Kubernetes2.故障转移和自愈能力的重要性二.Kubernetes概览1.Kubernetes架构2.Kubernetes组件和功能三.故障转移1.如何定义故障转移2.Kubernetes中的故障转移机制2.1健康检查2.2Pod和ReplicaSet2.3控制器和故障转移3.Pods和ReplicaSets之间的关系4.控制器和故障转移四.自愈能力1.如何定义自愈能力2.Kubernetes中的自愈能力机制2.1自动滚动升级2.2自动扩缩容2.3自动容错2.4自动更新配置2.5自动修复3.Pod健康监控4.什么是Liveness和Readiness探针五.Ku

【Kubernetes】 故障转移和自愈能力机制详解

文章目录一.引言1.介绍Kubernetes2.故障转移和自愈能力的重要性二.Kubernetes概览1.Kubernetes架构2.Kubernetes组件和功能三.故障转移1.如何定义故障转移2.Kubernetes中的故障转移机制2.1健康检查2.2Pod和ReplicaSet2.3控制器和故障转移3.Pods和ReplicaSets之间的关系4.控制器和故障转移四.自愈能力1.如何定义自愈能力2.Kubernetes中的自愈能力机制2.1自动滚动升级2.2自动扩缩容2.3自动容错2.4自动更新配置2.5自动修复3.Pod健康监控4.什么是Liveness和Readiness探针五.Ku

深度学习&故障诊断初学者 - 学习路线

针对该领域初学者,经常有人一头雾水,不知如何学习,因此本文提供了一个学习路线注:以下路线适合使用深度学习做故障诊断的初学者(建议使用Python、pytorch)深度学习+故障诊断学习路线stage1:Python入门-打好编程基础在线免费python入门编程网站1在线免费python入门编程网站2stage2:吴恩达课程讲深度学习理论-浅浅理解神经网络stage3:看10篇中文故障诊断论文-对故障诊断有个大概了解stage4:深度学习实战(一定要动手敲代码)stage5:了解故障诊断相关理论知识及信号处理方法stage6:实战初级故障诊断代码(同一转速间)基于卷积神经网络的轴承故障诊断算法研

深度学习&故障诊断初学者 - 学习路线

针对该领域初学者,经常有人一头雾水,不知如何学习,因此本文提供了一个学习路线注:以下路线适合使用深度学习做故障诊断的初学者(建议使用Python、pytorch)深度学习+故障诊断学习路线stage1:Python入门-打好编程基础在线免费python入门编程网站1在线免费python入门编程网站2stage2:吴恩达课程讲深度学习理论-浅浅理解神经网络stage3:看10篇中文故障诊断论文-对故障诊断有个大概了解stage4:深度学习实战(一定要动手敲代码)stage5:了解故障诊断相关理论知识及信号处理方法stage6:实战初级故障诊断代码(同一转速间)基于卷积神经网络的轴承故障诊断算法研