草庐IT

【安全狐】Windows隐藏计划任务技术及排查方法

0x00前置知识计划任务SCHTASKS命令SCHTASKSSCHTASKS/Create参数SCHTASKS/Create[/Ssystem[/Uusername[/P[password]]]][/RUusername[/RPpassword]]/SCschedule[/MOmodifier][/Dday][/Mmonths][/Iidletime]/TNtaskname/TRtaskrun[/STstarttime][/RIinterval][{/ETendtime|/DUduration}[/K][/XMLxmlfile][/V1]][/SDstartdate][/EDenddate][

使用Java自带的VisualVM监控远程服务器部署在Docker容器中的Java项目并使用Mat在线工具排查服务器内存泄露或内存溢出的原因

事情是这样的,我们项目最近应业主的要求迁移到了新的服务器,起初一切正常,部署、上线、测试都没有问题,项目大概运行了一周的工作日时间都没出现问题,直到周六那天,项目经理打电话过来说服务器崩了,图片上传不了,验证码加载不出来等各种问题。。。然后火速连到服务器dockerstats--no-stream查看了一下Docker命令中用来显示容器资源利用情况,发现这个Java服务一直在持续的上涨到15G左右(正常也就几百兆),以至于涨到服务器挂掉了。。。额,我初步怀疑是定时任务太多的问题。于是我马上咨询单位里经验比较丰富的大佬,让我去监控一下程序的进程,内存使用等情况。如果临时使用的话,就让我临时处理的

SpringBoot中Filter没有生效原因排查

我的一个老项目从SpringMvc升级到了SpringBoot、项目中使用了两个过滤器,分别是XSS注入过滤器和CSRF攻击过滤器。Servlet三大组件Servlet、Filter、Listener在传统项目中需要在web.xml中进行相应的配置。Servlet3.0开始在javax.servlet.annotation包下提供3个对应的@WebServlet、@WebFilter、@WebListener注解来简化操作,@WebServlet、@WebFilter、@WebListener写在对应的Servlet、Filter、Listener类上作为标识,从而不需要在web.xml中进行

k8s故障排查个案:当Pod内存持续增长,OOM问题如何解决?

pod运行一段时间后,内存持续增长,甚至oom的情况.动机容器化过程中,我们经常会发现kubernetes集群内pod的内存使用率会不停持续增长,加多少内存吃多少内存,如果对cgroup内存的构成不是很清楚的情况下,单纯看监控看不出什么问题。经过一番查阅,目前总结出大致有2种导致这种情况的场景。内存泄露io缓存案例分析我们先从内存泄露分析,刚好手头有个pod也是这种情况。内存泄露进入对应的pod内部。我们先看看它用了多少内存,prometheus也是取这个值做为容器的内存使用率的。#cat/sys/fs/cgroup/memory/memory.usage_in_bytes4192538624

Kubernetes 集群节点处于 Not Ready 问题排查

背景Kubernetes是一个强大的平台,用于自动化部署、扩展和操作容器中的应用程序。有时,您可能会遇到节点处于非就绪状态(“NotReady”)。本文将指导您逐步解决这些问题。当Kubernetes中的一个节点处于不可用状态时,需要立即排查。可以按照以下步骤来确定根本原因。检查节点的状态首先,您需要确认节点确实处于“未就绪”状态。使用以下命令列出所有节点的状态:kubectlgetnodes您将看到类似于这样的输出:NAMESTATUSROLESAGEVERSIONnode-1Ready30dv1.25.1node-2NotReady25dv1.25.1node-3Ready28dv1.25

问题排查太烦心,试试GPT的超能力

当你使用Kubernetes时,迟早会遇到集群中的问题,需要进行调试和修复,以便你的Pod和服务能够按预期运行。无论你是刚刚开始使用Kubernetes还是正在处理大规模且更复杂的环境,调试集群内进程并不总是那么简单,而且可能会成为一项耗时且困难的任务。云原生环境中有多种可用的调试解决方案,可帮助你访问集群内信息。然而,其中大多数不提供上下文信息。在这篇博文中,我将向你介绍K8sGPT,这个项目旨在为所有人提供Kubernetes的超能力。K8sGPT的应用场景概述K8sGPT于2023年4月由一群云原生生态系统中经验丰富的工程师启动。它是一个完全开源的项目。K8sGPT背后的主要思想是利用A

服务器GPU温度过高挂掉排查记录Unable to determine the device handle for GPU 0000:01:00.0: Unknown Error

服务器GPU挂掉跑深度学习的代码的时候发现中断了。通过命令查看:nvidia-smi显示UnabletodeterminethedevicehandleforGPU0000:01:00.0:UnknownError。感觉很莫名其妙。通过重启大法之后,又能用一段时间。shutdown-rnow但是过了一个小时左右又会挂掉。不能从根本解决问题。那么到底为什么GPU会自己挂掉呢?问题排查通过查看日志定位错误原因:nvidia-bug-report.sh在当前目录下生成了nvidia-bug-report.log日志文件。查看到日志文件的内容如下:网上查找一下这个报错码79https://forums

避免业务中断,K8s节点故障排查攻略,速来围观!

Kubernetes是一个强大的容器编排系统,但在运行过程中,节点故障可能会发生。本教程将引导您深入了解和排查K8S节点故障的常见问题,以确保集群的可靠性和稳定性。步骤一:检查节点状态首先,通过以下命令检查节点的整体状态:kubectlgetnodes执行上述命令,输入结果如下图:确认所有节点都处于Ready状态。如果有节点处于NotReady状态,可以运行以下命令查看详细信息:kubectldescribenode例如,现在要查看node01节点详细信息,如下图:步骤二:查看事件使用以下命令查看集群中的事件,以了解任何异常情况:kubectlgetevents执行上述命令,输入结果如下图:步

【Linux】CentOS网络故障排查大揭秘: 实战攻略解读

  🍎个人博客:个人主页🏆个人专栏:Linux⛳️  功不唐捐,玉汝于成目录前言正文检查网络连接状态:检查网络配置:重启网络服务:检查防火墙设置:查看日志文件:硬件检查:使用网络诊断工具:更新系统和驱动程序:结语 我的其他博客前言在管理CentOS服务器时,网络故障是一项常见但又令人头疼的问题。无论您是初学者还是经验丰富的管理员,都可能会遇到网络连接中断、DNS解析失败或者其他网络相关的故障。本文旨在提供一份详细的实战指南,帮助您迅速定位并解决CentOS系统中的网络故障,让您的服务器保持稳定和可靠。正文在管理CentOS服务器时,网络故障是经常遇到的问题之一。无论是因为网络配置错误、硬件故障

Nginx反向代理HTTPS域名时,502错误的问题排查与架构

在构建Web应用程序时,常常需要使用反向代理服务器来处理客户端请求。Nginx是一个流行的反向代理服务器,它具有高性能和灵活的配置选项。然而,有时在使用Nginx作为反向代理服务器时,可能会遇到502错误(BadGateway)的问题。这篇文章将帮助您了解如何排查和解决Nginx反向代理HTTPS域名时的502错误问题。502错误通常表示Nginx无法正确地将请求传递给后端服务器,并且无法从后端服务器获取有效的响应。这可能是由于多种原因引起的,包括后端服务器故障、网络连接问题或配置错误。下面我们将逐步分析可能导致502错误的几个常见原因,并提供相应的解决方案。检查后端服务器的健康状态:首先,确