草庐IT

优化命令之sar——最牛命令

糖醋·小排顾 2024-07-20 原文

目录

一:sar命令概述

1.1sar概述

1.2sar常用选项

1.3常用参数

二:CPU资源监控

2.1整体CPU使用统计(-u)

2.2各个CPU使用统计(-P)

2.3将CPU使用情况保存到文件中 

三:内存监控

3.1内存和交换空间监控

3.2内存分页监控

3.3系统交换活动信息监控 

四:I/O和传送速率监控与磁盘使用情况

4.1整体I/O情况(-b)

4.2各个I/O设备情况(-d) 

五:进程长度和CPU平均负载状态监控

六:网络宽带监控

七:一些可能会用到的选项

八:压力测试实验

8.1测试cpu占用率

8.1.1测试前cpu数据

8.1.2安装stress并进行测试

8.1.3进行测试后的数据

8.2测试内存占用率

8.2.1测试前内存数据 

8.2.2使用stress命令进行测试

8.2.3进行测试后的数据

8.3测试I/O与传输速率与磁盘使用情况 

8.3.1测试前数据

8.3.2使用stress命令进行测试

8.3.3进行测试后的数据

8.4检测网络流量 

8.4.1测试前的数据

8.4.2在另一台机器安装ab工具并进行测试

8.4.3进行测试后的数据

九:总结

前言:sar是一个Linux下的监控工具,一直站在鄙视链的顶端。但是往往因繁多的参数,让人望而生畏,不知道怎么使用。然而这么强大命令并非是无章可循,只要我们找到合适的切入点来分析这个工具,就会发现实际上是非常简单的


一:sar命令概述

#格式
sar -n DEV 1 5
-n:次数
DEV:类型参数
1:时间间隔
5:次数

1.1sar概述

sar命令很简单,它的参数主要分为四部分。其中,第二部分和第三、四部分,是可选的,也就是说,最终要的参数,就剩下一个,那就是选项不带选项默认是-u。

1.选项,也就是我们要获取的是哪个类型的指标数据,这里的-n,代表的是监控一些网络信息

2.类型参数,有的类型带有参数,有的没有。这里的DEV,代表的是监控网卡信息

3.时间间隔,表示多少采样一次数据,这里的1就是1秒

4.次数,表示采样的次数。比如时间间隔是3,采样次数是4,那么sar命令将会阻塞12秒钟

1.2sar常用选项

选项功能
-A所有报告的总和
-u输出CPU使用情况的统计信息
-v输出inode、文件和其他内核表的统计信息
-d输出每一个块设备的活动信息
-r输出内存和交换空间的统计信息
-b显示I/O和传送速率的统计信息
-a文件读写情况
-c输出进程统计信息,每秒创建的进程数
-R输出内存页面的统计信息
-y终端设备活动情况
-w输出系统交换活动信息

1.3常用参数

默认监控: sar 1 1     //  CPU和IOWAIT统计状态

sar -b 1 1        // IO传送速率

sar -B 1 1        // 页交换速率

sar -C 1 1        // 进程创建的速率

sar -d 1 1        // 块设备的活跃信息

sar -n DEV 1 1    // 网路设备的状态信息

sar -n SOCK 1 1   // SOCK的使用情况

sar -n ALL 1 1    // 所有的网络状态信息

sar -P ALL 1 1    // 每颗CPU的使用状态信息和IOWAIT统计状态

sar -q 1 1        // 队列的长度(等待运行的进程数)和负载的状态

sar -r 1 1      // 内存和swap空间使用情况

sar -R 1 1       // 内存的统计信息(内存页的分配和释放、系统每秒作为BUFFER使用内存页、每秒被cache到的内存页)

sar -u 1 1       // CPU的使用情况和IOWAIT信息(同默认监控)

sar -v 1 1       // inode, file and other kernel tablesd的状态信息

sar -w 1 1       // 每秒上下文交换的数目

sar -W 1 1       // SWAP交换的统计信息(监控状态同iostat 的si so)

 sar -y 1 1       // TTY设备的活动状态

sar -h           // 查看帮助


二:CPU资源监控

2.1整体CPU使用统计(-u)

使用-u选项,sar输出整体CPU的使用情况,不加选项时,默认使用的就是-u选项。以下命令显示采样时间为3s,采样次数为2次,整体CPU的使用情况:
sar 3 2 (或者 sar -u 1 3)

sar -u 1 3 或 sar 1 3  (1:每隔一秒刷新一次,3:刷新3次)

也可以使用 -p 查看全天

输出项详细说明
CPU

all表示统计信息为所有CPU的平均值

%user显示在用户级别(application)运行使用CPU总时间的百分比
%nice改变过优先级的进程的CPU使用率
%system内核空间的CPU使用率,在核心级别(kernel)运行使用CPU总时间的百分比
%iowait显示用于等待I/O操作占用CPU总时间的百分比
%steal管理程序(hypervisor)为另一个虚拟进程提供服务而等待虚拟CPU的百分比
%idle显示CPU空闲时间占用CPU总时间的百分比

 在以上的显示当中,主要看%iowait和%idle,%iowait过高表示存在I/O瓶颈,即磁盘IO无法满足业务需求,如果%idle过低表示CPU使用率比较严重,需要结合内存使用等情况判断CPU是否瓶颈

2.2各个CPU使用统计(-P)

sar -P ALL 1 1   #对每个内核输出统计信息

sar -P 0 1 1     #显示第一个内核的统计信息

“-P ALL”选项指示对每个内核输出统计信息:

2.3将CPU使用情况保存到文件中 

sar -u -o test 4 3  
#每4秒采样1次,连续采样3次,将采样结果以二进制形式存入当前目录下的文件test中
sar -u -f test
#查看二进制文件的内容


三:内存监控

3.1内存和交换空间监控

使用-r选项可显示内存统计信息,以下命令显示以1秒为采样时间,显示3次内存信息:

sar -r 1 3 (1:每隔一秒刷新一次,3:刷3次)

输出项详细说明
kbmemfree这个值和free命令中的free值基本一致,所以不包括buffer和cache空间
kbmemused这个值和free命令中的used值基本一致,所以包括buffer和cache的空间
%memused这个值是kbmemused和内存总量(不包括swap)的一个百分比
kbbuffers和kbcached这俩个值就是free命令中的buffer和cache
kbcommit保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap)
%commit这个值是kbcommit与内存总量(包括swap)的一个百分比(可以看做内存使用量的百分比)

3.2内存分页监控

sar -B 5 3
#每5秒采样一次,连续采样3次,监控内存分页

输出项说明:

选项

说明

pgpgin/s

表示每秒从磁盘或SWAP置换到内存的字节数(KB)

pgpgout/s

表示每秒从内存置换到磁盘或SWAP的字节数(KB)

fault/s

每秒钟系统产生的缺页数,即主缺页与次缺页之和(major + minor)

majflt/s

每秒钟产生的主缺页数

pgfree/s

每秒被放入空闲队列中的页个数

pgscank/s

每秒被kswapd扫描的页个数

pgscand/s

每秒直接被扫描的页个数

pgsteal/s

每秒钟从cache中被清除来满足内存需要的页个数

%vmeff

每秒清除的页(pgsteal)占总扫描页(pgscank+pgscand)的百分比

3.3系统交换活动信息监控 

sar -w 1 3 (1:每秒上下文交换的数目,3:刷新三次)

pswpin/s

每秒系统换入的交换页面(swap page)数量

pswpout/s

每秒系统换出的交换页面(swap page)数量


四:I/O和传送速率监控与磁盘使用情况

sar的I/O和磁盘使用情况是有点重合的

4.1整体I/O情况(-b)

sar -b 1 3 (1:每隔一秒刷新一次,3:刷新3次)

输出项详细说明
tps每秒物理设备的I/O传输总量
rtps每秒从物理设备读入的数据总量
%util表示一秒中有百分之几的时间用于I/O操作
wtps每秒向物理设备写入的数据总量
bread/s

每秒从物理设备读入的数据量,单位为块/s

bwrtn/s

每秒向物理设备写入的数据量,单位为块/s

4.2各个I/O设备情况(-d) 

sar -d 1 3 (1:每隔一秒刷新一次,3:刷新3次)
sar -d -p 1 3  #-p可以以sdx的形式显示

参数-p可以打印出sda,hdc等磁盘设备名称,如果不用参数-p,设备节点则有可能是dev8-0,dev22-0 

选项

说明

rd_sec/s

每秒从设备读取的扇区数

wr_sec/s

每秒往设备写入的扇区数

avgrq-sz

发送给设备的请求的平均大小(以扇区为单位)

avgqu-sz

发送给设备的请求队列的平均长度

await

服务等待I/O请求的平均时间,包括请求队列等待时间 (单位毫秒)

svctm

设备处理I/O请求的平均时间,不包括请求队列等待时间 (单位毫秒)

%util

一秒中有百分之多少的时间用于 I/O 操作,即被io消耗的cpu百分比

如果 %util 接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈。

如果 svctm 比较接近 await,说明 I/O 几乎没有等待时间;如果 await 远大于 svctm,说明I/O 队列太长,io响应太慢,则需要进行必要优化。

如果avgqu-sz比较大,也表示有大量io在等待


五:进程长度和CPU平均负载状态监控

sar -q 1 3      //1:每隔一秒刷新一次,3:总共刷新三次

输出项详细说明
runq-sz运行队列的长度(等待运行的进程数)
plist-sz进程列表中进程(processes)和线程(threads)的数量
Idavg-1最后1分钟的CPU平均负载,即将多核CPU过去一分钟的负载相加再除去核心数得出的平均值,5分钟和15分钟以此类推
Idavg-5最后5分钟的CPU平均负载
Idavg-15最后15分钟的CPU平均负载
blocked

六:网络宽带监控

sar -n DEV 1 3

sar命令使用-n选项可以汇报网络相关信息,可用的参数包括:DEV、EDEV、SOCK和FULL

IFACE

就是网络设备的名称

rxpck/s

每秒钟接收到的包数目

txpck/s

每秒钟发送出去的包数目

rxbyt/s

每秒钟接收到的字节数

txbyt/s

每秒钟发送出去的字节数

rxcmp/s

每秒钟接收到的压缩包数目

txcmp/s

每秒钟发送出去的压缩包数目

txmcst/s

每秒钟接收到的多播包的包数目

查看网络信息的参数还有很多,就不一一举例,毕竟大多数时候我们只和DEV打交道,这边我就把它举出来了。

DEV 网卡

EDEV 网卡 (错误)

NFS NFS 客户端

NFSD NFS 服务器

SOCK Sockets (套接字) (v4)

IP IP 流 (v4)

EIP IP 流 (v4) (错误)

ICMP ICMP 流 (v4)

EICMP ICMP 流 (v4) (错误)

TCP TCP 流 (v4)

ETCP TCP 流 (v4) (错误)

UDP UDP 流 (v4)

SOCK6 Sockets (套接字) (v6)

IP6 IP 流 (v6)

EIP6 IP 流 (v6) (错误)

ICMP6 ICMP 流 (v6)

EICMP6 ICMP 流 (v6) (错误)

UDP6 UDP 流 (v6)


七:一些可能会用到的选项

将结果输出到文件(-o)和读取记录信息(-f)

-f可以读取二级制存储的数据文件,所以我们也可以用它来读取之前的日志文件中的系统数据

监控indo、文件和其他内核监控

sar -v 1 3

dentunusd

目录高速缓存中未被使用的条目数量

file-nr

文件句柄(file handle)的使用数量

inode-nr

索引节点句柄(inode handle)的使用数量

pty-nr

使用的pty数量

内存分页监控:sar -B 1 3

pgpgin/s

表示每秒从磁盘或SWAP置换到内存的字节数(KB)

pgpgout/s

表示每秒从内存置换到磁盘或SWAP的字节数(KB)

fault/s

每秒钟系统产生的缺页数,即主缺页与次缺页之和(major + minor)

majflt/s

每秒钟产生的主缺页数

pgfree/s

每秒被放入空闲队列中的页个数

pgscank/s

每秒被kswapd扫描的页个数

pgscand/s

每秒直接被扫描的页个数

pgsteal/s

每秒钟从cache中被清除来满足内存需要的页个数

%vmeff

每秒清除的页(pgsteal)占总扫描页(pgscank+pgscand)的百分比

要判断系统瓶颈问题,有时需几个 sar 命令选项结合起来

怀疑CPU存在瓶颈,可用 sar -u 和 sar -q 等来查看

怀疑内存存在瓶颈,可用 sar -B、sar -r 和 sar -W 等来查看

怀疑I/O存在瓶颈,可用 sar -b、sar -u 和 sar -d 等来查看


八:压力测试实验

8.1测试cpu占用率

8.1.1测试前cpu数据

8.1.2安装stress并进行测试

yum install epel-release -y
yum install stress -y

8.1.3进行测试后的数据

8.2测试内存占用率

8.2.1测试前内存数据 

8.2.2使用stress命令进行测试

stress --vm 2 --vm-bytes 1G --vm-hang 100 --timeout 100s
开启2个进程分配内存,每次分配1GB内存,保持100秒后释放,100秒后退出

8.2.3进行测试后的数据

8.3测试I/O与传输速率与磁盘使用情况 

8.3.1测试前数据

8.3.2使用stress命令进行测试

stress --io 15 --hdd 15 --timeout 600

8.3.3进行测试后的数据

8.4检测网络流量 

8.4.1测试前的数据

8.4.2在另一台机器安装ab工具并进行测试

yum install httpd-tools -y

ab -n 40000 -c 1000 http://192.168.137.10/
-n指定并发数
-c指定并发次数
注意:网址后面一定要加上 / 斜杠结尾

8.4.3进行测试后的数据


九:总结

sar功能全面,可以统计很多系统数据

整体CPU使用统计;各个CPU使用统计;内存使用情况统计;整体I/O情况;各个I/O设备情况;网络统计

有关优化命令之sar——最牛命令的更多相关文章

  1. ruby - 在 Ruby 中编写命令行实用程序 - 2

    我想用ruby​​编写一个小的命令行实用程序并将其作为gem分发。我知道安装后,Guard、Sass和Thor等某些gem可以从命令行自行运行。为了让gem像二进制文件一样可用,我需要在我的gemspec中指定什么。 最佳答案 Gem::Specification.newdo|s|...s.executable='name_of_executable'...endhttp://docs.rubygems.org/read/chapter/20 关于ruby-在Ruby中编写命令行实用程序

  2. ruby-on-rails - rbenv:从 RVM 移动到 rbenv 后,在 Jenkins 执行 shell 中找不到命令 - 2

    我从Ubuntu服务器上的RVM转移到rbenv。当我使用RVM时,使用bundle没有问题。转移到rbenv后,我在Jenkins的执行shell中收到“找不到命令”错误。我内爆并删除了RVM,并从~/.bashrc'中删除了所有与RVM相关的行。使用后我仍然收到此错误:rvmimploderm~/.rvm-rfrm~/.rvmrcgeminstallbundlerecho'exportPATH="$HOME/.rbenv/bin:$PATH"'>>~/.bashrcecho'eval"$(rbenvinit-)"'>>~/.bashrc.~/.bashrcrbenvversions

  3. ruby - 从 Ruby : capturing the output while displaying the output? 运行 shell 命令 - 2

    我有一个问题。我想从另一个ruby​​脚本运行一个ruby​​脚本并捕获它的输出信息,同时让它也输出到屏幕。亚军#!/usr/bin/envrubyprint"Enteryourpassword:"password=gets.chompputs"Hereisyourpassword:#{password}"我运行的脚本文件:开始.rboutput=`runner`putsoutput.match(/Hereisyour(password:.*)/).captures[0].to_s正如您在此处看到的那样,存在问题。在start.rb的第一行,屏幕是空的。我在运行程序中看不到“输入您的密

  4. ruby - 是否有将图像文件转换为 ASCII 艺术的命令行程序或库? - 2

    有这样的事吗?我想在Ruby程序中使用它。 最佳答案 试试这个http://csl.sublevel3.org/jp2a/此外,Imagemagick可能还有一些东西 关于ruby-是否有将图像文件转换为ASCII艺术的命令行程序或库?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/6510445/

  5. ruby - 在 Ruby 的 if 语句中检查 bash 命令 - 2

    如何在Ruby的if语句中检查bash命令的返回值(true/false)。我想要这样的东西,if("/usr/bin/fswscell>/dev/null2>&1")has_afs="true"elsehas_afs="false"end它会提示以下错误含义,它总是返回true。(irb):5:warning:stringliteralincondition正确的语法是什么?更新:/usr/bin/fswscell寻找afs安装和运行状态。它会抛出这样的字符串,Thisworkstationbelongstocell如果afs没有运行,命令以状态1退出 最

  6. ruby - 可以正常中断的来自 Rake 的长时间运行的 shell 命令? - 2

    在几个项目中,我希望有一个类似rakeserver的rake任务,它将通过任何需要的方式开始为该应用程序提供服务。这是一个示例:task:serverdo%x{bundleexecrackup-p1234}end这行得通,但是当我准备停止它时,按Ctrl+c并没有正常关闭;它中断了Rake任务本身,它说rakeaborted!并给出堆栈跟踪。在某些情况下,我必须执行Ctrl+c两次。我可能可以用Signal.trap写一些东西来更优雅地中断它。有没有更简单的方法? 最佳答案 trap('SIGINT'){puts"Yourmessa

  7. ruby - Capistrano 中的执行、测试和捕获命令有什么区别? - 2

    关于SSHkit-Github它说:Allbackendssupporttheexecute(*args),test(*args)&capture(*args)来自SSHkit-Rubydoc,我明白execute实际上是test的别名?test之间有什么区别?,execute,capture在Capistrano/SSHKit中我应该什么时候使用? 最佳答案 执行只是执行命令。使用非0退出引发错误。测试方法的行为与execute完全相同,但是它返回bool值(true如果命令以0退出,而false否则)。它通常用于控制任务中的流程

  8. ruby - 如何在 Ruby 中执行 Windows CLI 命令? - 2

    我在目录“C:\DocumentsandSettings\test.exe”中有一个文件,但是当我用单引号编写命令时`C:\DocumentsandSettings\test.exe(我无法在此框中显示),用于在Ruby中执行命令,我无法这样做,我收到的错误是找不到文件或目录。我尝试用“//”和“\”替换“\”,但似乎没有任何效果。我也使用过系统、IO.popen和exec命令,但所有的努力都是徒劳的。exec命令还使程序退出,这是我不想发生的。提前致谢。 最佳答案 反引号环境就像双引号,所以反斜杠用于转义。此外,Ruby会将空格解

  9. ruby - 将命令行上的变量传递给 Cucumber 测试 - 2

    我正在尝试将cucumber项目的用户名和密码置于版本控制之外。有没有办法在命令行上手动将用户名和密码等变量传递给Cucumber脚本?我的备份计划是将它们放在一个YML文件中,然后将该文件添加到gitignore,这样它们就不会被置于版本控制中。 最佳答案 所以,我看到了您对铁皮人的评论,答案是肯定的。cucumberPASSWORD=my_passwordPASSWORD被设置为环境变量,您可以通过将其引用为ENV['PASSWORD']来使用它的值。例如,browser.text_field(:id=>'pwd').setEN

  10. ruby - 无法安装 gem - make 未被识别为内部或外部命令可运行程序或批处理文件 - 2

    我想在Windows7上安装带有ruby​​1.9.3的rspec-railsgem。我收到一些错误消息,提示无法安装某些json库。所以,我使用下面的说明来解决它。来源=The'json'nativegemrequiresinstalledbuildtools从[rubyinstaller.org][3]下载[Ruby1.9.3][2]从[rubyinstaller.org][3]下载DevKit文件对于Ruby1.9.3,使用[DevKit-tdm-32-4.5.2-20110712-1620-sfx.exe][4]将DevKit解压到路径C:\Ruby193\DevKit运行cd

随机推荐