我们经常收到 /var/log/messages 中的消息
kernel: SLUB: Unable to allocate memory on node -1 (gfp=0x8020)
在某些情况下后面跟着一个分配表
kernel: cache: sigqueue(12019:454c4ebd186d964699132181ad7367c669700f7d8991c47d4bc053ed101675bc), object size: 160, buffer size: 160, default order: 0, min order: 0
kernel: node 0: slabs: 57, objs: 23313, free: 0
kernel: node 1: slabs: 35, objs: 14315, free: 0
好吧,免费是 0,但是如何调整呢?
以下为设置信息
OS - Centos7.3
Kernel - 3.10.0-327.36.3.el7.x86_64
Docker - 1.12.6
Kubernetes - 1.5.5
我们拥有由 kurbernetes 提供支持的私有(private)云,有 10 个节点;直到上个月它都运行良好,现在我们在每个节点上都非常频繁地收到这些警报,最近几天 pod/容器也增加了。
我们在每个节点上都有足够的内存 和cpu 可用。
对这些警报进行任何微调都会非常有帮助。
附加信息:
sysctl.conf 选项
net.ipv4.tcp_timestamps = 0
net.ipv4.tcp_max_syn_backlog = 4096
net.core.somaxconn = 1024
net.ipv4.tcp_syncookies = 1
net.core.rmem_max = 16777216
net.core.wmem_max = 16777216
net.core.rmem_default = 65535
net.core.wmem_default = 65535
net.ipv4.tcp_rmem = 4096 87380 16777216
net.ipv4.tcp_wmem = 4096 65536 16777216
net.ipv4.ip_local_port_range = 1024 65535
vm.max_map_count = 262144
vm.swappiness=10
vm.vfs_cache_pressure=100
最佳答案
请看这个:https://pingcap.com/blog/try-to-fix-two-linux-kernel-bugs-while-testing-tidb-operator-in-k8s/ .这是一个内核错误。
关于Linux SLUB : Unable to allocate memory on node,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43405813/