草庐IT

k8s服务突然中断重启原因排查-eviction manager: must evict pod(s) to reclaim memory

1.故障背景20230512早上9点半左右,服务突然中断造成产品不可用。2.设想重启原因:1.时间端内有占用大内存操作,定时任务,造成内存溢出或者探针失败重启2.时间段内业务高峰,内存溢出或探针失败重启3.kafka大量失败造成应用重启。那么kafka失败原因排查3.排查过程3.1排查应用不可用探针失败造成重启首先查看pod状态:所有pod都有一次重启记录。检查pod状态:因为pod已经重启了。查看现在pod详情还是可以看到探针超时。检查探针设置:PodEvents中超时的是readiness探针。解释下探针:readinessprobes:就绪性探针,用于检测应用实例当前是否可以接收请求,如

java - Java中的垃圾收集

在我正在修改的幻灯片上写着以下内容:Liveobjectscanbeidentifiedeitherbymaintainingacountofthenumberofreferencestoeachobject,orbytracingchainsofreferencesfromtheroots.Referencecountingisexpensive–itneedsactioneverytimeareferencechangesanditdoesn’tspotcyclicalstructures,butitcanreclaimspaceincrementally.Tracinginvol

java - Java中的垃圾收集

在我正在修改的幻灯片上写着以下内容:Liveobjectscanbeidentifiedeitherbymaintainingacountofthenumberofreferencestoeachobject,orbytracingchainsofreferencesfromtheroots.Referencecountingisexpensive–itneedsactioneverytimeareferencechangesanditdoesn’tspotcyclicalstructures,butitcanreclaimspaceincrementally.Tracinginvol

Java 垃圾收集器 :old generation becomes larger and larger and cannot be reclaimed

我正在编写我的servlet程序并使用jconsole和jmap来监视其内存状态。我发现当我的程序运行时,内存池“PSOldGen”变得越来越大,最后我的servlet无法响应任何请求.这是我的JConsole输出的截图:当我点击“执行GC”按钮时,没有任何反应。因此,为了查看详细信息,我使用jmap转储详细信息:这是我的JConsoleVM摘要输出:任何人都可以帮助我找出可能是什么问题?你知道,GC“PSMarkSweep”和“PS​​SCavenge”是我的服务器JVM的默认GC。谢谢。我发现一个很奇怪的现象:从昨天18:00到今天09:00这15个小时里,“PSOldGen”上的

docker - docker system df中显示的 "RECLAIMABLE"空间是什么?

可以使用命令dockersystemdf(mirror)(在Docker1.13.0中引入)查看docker磁盘使用情况,例如:username@server:~$dockersystemdfTYPETOTALACTIVESIZERECLAIMABLEImages4428114.7GB84.84GB(73%)Containers86762.43GB41.67GB(66%)LocalVolumes210B0BBuildCache0B0Bdockersystemdf中显示的“RECLAIMABLE”是如何计算的?即,它代表什么?dockerdocumentationondockersyst