草庐IT

1.腾讯轻服务器K3S环境配置

1.腾讯轻服务器K3S系统安装前端时间买了三年腾讯轻服务器,现在准备学习下K8S,但是服务器资源少,退而求其次的使用腾讯轻服务器默认的K3S系统。1.获取按照提示,获取token,2.防火墙开启9090端口,输入url:http://公网IP:9090登录;3.开启SSH远程连接:创建密钥,默认下载文件,windows本地重命名增加后缀.pub,CRT通过公钥进行SSH登录。2.Kubernetes-dashboard 输入url:http://公网IP:9090,可以看到相关菜单点击右上角“+”,可以创建yaml文件进行服务部署 3.后台查看K3S相关信息[root@VM-16-5-cent

ubuntu - 完成作业不稳定的 Kubernetes 集群;充满 "http2: no cached connection was available"的 kubelet 日志

总结我有各种单节点Kubernetes集群,这些集群在累积约300个已完成的作业后变得不稳定。例如,在一个集群中,有303个已完成的作业:root@xxxx:/home/xxxx#kubectlgetjobs|wc-l303观察我观察到的是kubelet日志中充满了这样的错误消息:kubelet[877]:E021909:06:14.637045877reflector.go:134]object-"default"/"job-162273560":无法列出*v1.ConfigMap:获取https://172.13.13.13:6443/api/v1/namespaces/defau

go - 如何构建 Kubernetes 以便将调试信息包含在可执行文件中?

在尝试调试kubelet中的panic时,我一直在尝试将delve附加到kubelet可执行文件,但没有成功:me@mycomputer:~$sudodlvattach23796couldnotattachtopid23796:couldnotopendebuginfofile和objdump--syms显示kubelet中没有调试信息:me@mycomputer:~$file_output/bin/kubelet_output/bin/kubelet:ELF64-bitLSBexecutable,x86-64,version1(SYSV),dynamicallylinked,inte

go - 如何转储正在运行的 kubelet 的 goroutines 堆栈竞争

kubernetes比较复杂,kubelet在某些场景长时间运行会出现死锁。有没有办法转储正在运行的kubelet的goroutine堆栈跟踪?如下所示的预期输出对调试kubelet的死锁类问题非常有帮助。goroutine386[chansend,1140minutes]:k8s.io/kubernetes/pkg/kubelet/pleg.(*GenericPLEG).relist(0xc42069ea20)/workspace/anago-v1.11.5-beta.0.24+753b2dbc622f5c/src/k8s.io/kubernetes/_output/dockeriz

k8s kubelet 服务无法启动报 code=exited, status=1/FAILURE错误 多种原因及解决

出现这种问题的原因有多种,如果status=255且反复重启动则是正常的,配置并创建pod后就好了。如果是status=1/FAILURE则可能是以下几种问题具体如下1.证书过期导致kubelet无法正常起动。可以参考:k8skubelet服务无法启动报code=exited,status=1/FAILURE错误_世宝宝的博客-CSDN博客_code=exitedstatus=1/failure2.驱动问题,即docker的驱动与kubelet驱动不一致(1)查看docker驱动root@rancher-master:~#dockerinfo|grepCgroupCgroupDriver:cg

记一则K8S Node NotReady故障

报障:    今日上午,值班同学发现airflow无法使用。查看时其部署的Node节点NotReady了。分析:    马上查看K8S集群节点的状态,发现这个节点已经是NotReady状态了。第一反应就是ping下节点看是否宕机了?ping正常,于是登录到该节点查看kubelet状态。发现kubelet报runtime不可用,查看containerd的状态,一直在不断的重启,而且启动不成功。为了尽快恢复业务,决定先将containerd的数据目录清空后重新拉起。于是删除containerd数据目录下的文件夹:#ls-lrth/xpu-k8s-data/containerd/total0drwx

云上攻防-云原生篇&Kubernetes&K8s安全&API&Kubelet未授权访问&容器执行

知识点1、云原生-K8s安全-名词架构&各攻击点2、云原生-K8s安全-Kubelet未授权访问3、云原生-K8s安全-APIServer未授权访问章节点:云场景攻防:公有云,私有云,混合云,虚拟化集群,云桌面等云厂商攻防:阿里云,腾讯云,华为云,亚马云,谷歌云,微软云等云服务攻防:对象存储,云数据库,弹性计算服务器,VPC&RAM等云原生攻防:Docker,Kubernetes(k8s),容器逃逸,CI/CD等K8S集群架构解释Kubernetes通俗来讲就是用来管理多台主机上的docker容器的一个开源平台应用。1、Master节点(控制端)2、Node节点(主机)3、Pod(容器)具体参

解决kubelet报failed to get imageFs info: non-existent label \“docker-images\“

问题:一环境主机重启后,查看kubelet日志经常有大量无法回收镜像文件报错,会导致kubelet的pleg不健康,从而导致kubelet发生重启。报错如下:解决办法解决方法一:systemctlstopdockersystemctlstopkubeletsystemctlstartdockersystemctlstartkubelet解决方法二:在kubelet的kubelet.service文件中,添加如下参数:[Unit]After=docker.service原因总结:主机重启后,kubelet比docker先启动,会对不健康的pod进行一个资源回收的过程,这个时候docker还没正常

自建K8S一年多没用,忽然想使用下。kubelet启动失败,报错:main process exited, code=exited, status=255/n/a

通过systemstatuskubelet查看报错,基本没有什么有效信息,所以使用journalctl-xefukubelet就可以看到以下报错:Jan1620:49:17masterkubelet[3824]:I011620:49:17.402577  3824server.go:425]Version:v1.15.0Jan1620:49:17masterkubelet[3824]:I011620:49:17.402770  3824plugins.go:103]Nocloudproviderspecified.Jan1620:49:17masterkubelet[3824]:I011620

【k8s】k8s 集群 kubelet日志报错 command failed“ err=“failed to parse kubelet flag: unknown flag: --network-p

项目场景:服务器异常断电后在k8s集群getnodes出现E040815:31:50.40095423612memcache.go:265]couldn'tgetcurrentserverAPIgrouplist:Get"https://192.168.0.20:6443/api?timeout=32s":dialtcp192.168.0.20:6443:connect:connectionrefused问题描述查看kubelet服务状态systemctlstatuskubelet.service发现服务处于loaded状态,kubelet.serviceenteredfailedstate.