Fio工具详解【强大的IO性能压测工具】

ZhangYing. 2023-04-05 原文

文章目录

Fio压测工具操作

Fio压测工具操作

fio -name=iouring_test -filename=/mnt/vdd/testfile -iodepth=128 -thread -rw=randread -ioengine=io_uring -sqthread_poll=1 -direct=1 -bs=4k -size=10G -numjobs=1 -runtime=120 -group_reporting

常用参数

[time]

runtime=time

告诉fio在指定的时间段后终止处理。很难确定指定作业将运行多长时间，因此此参数可以方便的将总运行时间限制为给定时间。当省略单位时间，该数值以秒为单位进行解释。

time_based

如果设置，即使文件被完全读取或写入，fio也将在指定的运行期间运行。它会在runtime准许时间内多次循环相同的工作负载。

ramp_time=time

如果设置，fio将在记录任何性能数据之前这段时间内运行指定的工作负载。有助于在记录结果之前，让性能稳定下来，从而最大限度的减少稳定结果所需的运更新时间。请注意，ramp_time被认为是作业的提前信息，因此如果指定了特殊的超时或者运行时间，它将增加总运行时间。当省略单位时，该值以秒为单位。可以减少日志对高速IO的影响。

[I/O tpye]

direct=bool

是否使用 direct io，测试过程不使用OS 自带的buffer，使测试磁盘的结果更真实。Linux读写的时候，内核维护了缓存，数据先写到缓存，后面在后台写到SSD。读的时候也优先读缓存里的数据。这样速度可以加快，但是一旦掉电，缓存里的数据就没有了。所以有一种模式叫做direct io，跳过缓存，直接读写SSD。

rw=randwrite

测试随机写的I/O：

顺序IO是指读写操作的访问地址顺序连接，顺序的操作磁道搜索时间显著减少，因为磁头可以以最小的移动访问下一块。【数据备份和日志记录都是顺序IO业务】

随机IO是指读写操作时间连续，但是访问地址不连续，随机分布在磁盘的地址空间中。产生随机IO的业务有OLTP服务，SQL等。

rw=randrw

测试随机写或者读的IO

rwmixwrite=int

在混合读写模式下，写占用30%。

[Blocks size]

bs=int

单次IO的块文件大小为16k

bsrange=1k-4k,2k-8k,1k-4k

指定数据块的大小范围，可以为读取、写入和修剪指定逗号分割的范围。

size=5G

每个线程读写的数据量是5GB

[Job description]

name=str

一个任务的名字，重复了也没关系。如果fio -name=job1 -name=job2，建立了两个任务，共享-name=job1之前的参数。-name=job1之后的就是job2任务独有的参数。

numjobs=int

创建此作业的指定数量的克隆。每个作业克隆都作为一个独立的线程或者进程产生（执行相同工作的进程或者线程）。每个Job(任务)开1个线程，有多少 -name 就开多少个线程。所以最终线程数 = 任务数（-name 的数量） * numjiobs。

filename=str

测试文件的名称。指定相对路径或者绝对路径。没有的话会自行创建。

[Threads, processes and job synchronization]

thread

Fio默认使用fork创建作业，如果给出此选项，将会以pthread_create(3) 创建作业。使用fork创建线程的开销比较大。

threads=int

指定线程的数量

[I/O engine]

ioengine=<str>

str: sync 基本的同步·读写操作，参考fsync和fdatasync

str:psync 基于 pread(2) 或者 pwrite(2) 进行IO操作。

str:vsync

str:pvsync

str:pvsync2:

str:io_uring 快速的Linux原生异步I/O。支持直接和缓冲IO操作。

str:io_uring_cmd 用于传递命令的快速Linux本机异步I/O。

str:libaio linux异步I/O。注意：Linux可能只支持具有非缓冲I/O的排队行为（设置为direct=1或buffered=0： rbd：通过librbd直接访问CEPH Rados

userspace_reap:[libaio]

通常，在使用libaio引擎的情况下，fio将使用io_getevents(2)系统调用来获取新返回的事件。打开此标志后，将直接从客户空间读取AIO环以获取事件。提高异步IO的收割速度。当轮询至少0个事件时候，收割模式才会启动。(iodepth_batch_complete=0)

[IO depth]

iodepth=int

队列的深度。在异步模式下，CPU不能一直无限的发命令到SSD。比如SSD执行读写如果发生了卡顿，那有可能系统会一直不停的发命令，几千个，甚至几万个，这样一方面SSD扛不住，另一方面这么多命令会很占内存，系统也要挂掉了。

iodepth 技巧

大致把延迟分为两部分，第一部分是读写本身需要的时间ts，第二部分是路上的网络、上下文切换时间tl。

iodepth可降低tl占比，提高ts占比：
iodepth可以批量提交请求，所以可以降低上下文切换的次数。
当ts本身占比很高的时候，那就没有提升的空间了。
如果ts占比较低，通过提高iodepth就可以提升iops。

[Buffers and memory]

lockmem=int

使用mlock(2)固定指定数量的内存。可用于模拟较小的内存量。只使用指定内存进行测试。

zero_buffers

用全零初始化缓冲区。默认值：用随机数据填充缓冲区。

[Target file/device]

nrfiles=int

用于此作业文件数。默认为1.除非文件大小明确指定大小，否则文件大小将是数据量除以nrfiles的大小。文件是为每个线程单独创建的。默认情况下，每个文件的名称中都有一个文件编号。

opendir=str

让fio递归的添加目录下和子目录下的所有文件。

[command line options]

--output=filename

输出日志信息到指定的文件。

--output-format=format

指定输出文件的格式。将日志格式设置为normal、terse、json 或 json+。可以选择多种格式，以逗号分隔。terse 是一种基于 CSV 的格式。json+ 类似于 json，只是它添加了延迟存储桶的完整转储。

[Measurements and reporting]

group_reporting

关于显示结果的，汇总每个进程的信息。

stats=bool

默认情况下，fio收集并显示所有运行的作业的最终输出结果。如果此选项设置为0，则fio将在最终统计输出中忽略它。

write_bw_log=str

如果给定，为此作业编写带宽日志。可以用于存储作业在其生命周期内的宽带数据。

write_lat_log=str

与write_bw_log相同，只是此选项创建 I/O 提交（例如，name_slat.x.log）、完成（例如，name_clat.x.log）和总（例如，name_lat.x.log）延迟文件。有关文件名格式的详细信息，请参阅write_bw_log，并了解数据在文件中的结构，请参阅日志文件格式。

write_hist_log=str

与write_bw_log相同，但改为写入I/O完成延迟直方图（例如 name_hist.x.log)。

fio压测示例

#针对io_uring的fixedufs特性
fio -threads=8 -size=10G -name=test -group_reporting -filename=./io.tmp -runtime=60 --ioengine=io_uring --iodepth=512 --fixedbufs 

#针对io_uring的sqthread_poll特性
fio -threads=8 -size=10G -name=test -group_reporting -filename=./io.tmp -runtime=60 --ioengine=io_uring --iodepth=512 --sqthread_poll 1

日志数据说明

[root@docker sda]# fio -ioengine=libaio -bs=4k -direct=1 -thread -rw=read -filename=/dev/sda -name="BS 4KB read test" -iodepth=16 -runtime=60
BS 4KB read test: (g=0): rw=read, bs=(R) 4096B-4096B, (W) 4096B-4096B, (T) 4096B-4096B, ioengine=libaio, iodepth=16
fio-3.7
Starting 1 thread
Jobs: 1 (f=1): [R(1)][100.0%][r=89.3MiB/s,w=0KiB/s][r=22.9k,w=0 IOPS][eta 00m:00s]
BS 4KB read test: (groupid=0, jobs=1): err= 0: pid=18557: Thu Apr 11 13:08:11 2019
   read: IOPS=22.7k, BW=88.5MiB/s (92.8MB/s)(5313MiB/60001msec)
    slat (nsec): min=901, max=168330, avg=6932.34, stdev=1348.82
    clat (usec): min=90, max=63760, avg=698.08, stdev=240.83
     lat (usec): min=97, max=63762, avg=705.17, stdev=240.81
    clat percentiles (usec):
     |  1.00th=[  619],  5.00th=[  627], 10.00th=[  627], 20.00th=[  635],
     | 30.00th=[  635], 40.00th=[  685], 50.00th=[  717], 60.00th=[  725],
     | 70.00th=[  725], 80.00th=[  725], 90.00th=[  734], 95.00th=[  816],
     | 99.00th=[ 1004], 99.50th=[ 1020], 99.90th=[ 1057], 99.95th=[ 1057],
     | 99.99th=[ 1860]
   bw (  KiB/s): min=62144, max=91552, per=100.00%, avg=90669.02, stdev=3533.77, samples=120
   iops        : min=15536, max=22888, avg=22667.27, stdev=883.44, samples=120
  lat (usec)   : 100=0.01%, 250=0.01%, 500=0.01%, 750=93.85%, 1000=5.14%
  lat (msec)   : 2=0.99%, 4=0.01%, 10=0.01%, 50=0.01%, 100=0.01%
  cpu          : usr=5.35%, sys=23.17%, ctx=1359692, majf=0, minf=17
  IO depths    : 1=0.1%, 2=0.1%, 4=0.1%, 8=0.1%, 16=100.0%, 32=0.0%, >=64=0.0%
     submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
     complete  : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.1%, 32=0.0%, 64=0.0%, >=64=0.0%
     issued rwts: total=1360097,0,0,0 short=0,0,0,0 dropped=0,0,0,0
     latency   : target=0, window=0, percentile=100.00%, depth=16
 
Run status group 0 (all jobs):
   READ: bw=88.5MiB/s (92.8MB/s), 88.5MiB/s-88.5MiB/s (92.8MB/s-92.8MB/s), io=5313MiB (5571MB), run=60001-60001msec
 
Disk stats (read/write):
  sda: ios=1357472/0, merge=70/0, ticks=949141/0, in_queue=948776, util=99.88%

[io=执行多少M的IO]

参数	内容
bw	平均IO带宽
iops	IOPS
runt	线程运行时间
slat	提交延迟，提交该IO请求到kernel所花的时间（不包括kernel处理的时间）
clat	完成延迟, 提交该IO请求到kernel后，处理所花的时间
lat	响应时间
bw	带宽
cpu	利用率
IO depths	io队列
IO submit	单个IO提交要提交的IO数
IO complete	Like the above submit number, but for completions instead.
IO issued	发出的读写请求数量，以及数量不足的请求
IO laencies	IO完成延迟的分布

[io=总共执行了多少size的IO]

参数	内容
aggrb	group总带宽
minb	最小平均带宽
maxb	最大平均带宽
mint	group中线程的最短运行时间
maxt	group中线程的最长运行时间
ios	所有group总共执行的IO数
merge	总共发生的IO合并数
ticks	Number of ticks we kept the disk busy
io_queue	花费在队列上的总共时间
util	磁盘利用率

图像化工具GFIO

yum install gtk2 gtk2-devel gtk2-devel-docs //安装依赖项
git clone git://git.kernel.dk/fio.git
cd fio*
./configure --enable-gfio 
make fio
make gfio
./fio -S
fio:server listening on 0.0.0.0, 8765 //开启服务端

参考 link

1. fio - Flexible I/O tester rev. 3.32 — fio 3.32-43-g0ebd3-dirty documentation
(105条消息) linux FIO命令详解(一)：磁盘IO测试工具 fio (并简要介绍iostat工具)_Yannick_J的博客-CSDN博客_fio命令
 (105条消息) 【详细齐全】FIO使用方法及参数解析（文章末尾）_天健胡马灵越鸟的博客-CSDN博客_fio官网
 FIO测试工具中的iodepth具体指的是什么? - 知乎 (zhihu.com)
fio - OpenAnolis 龙蜥操作系统开源社区

详解强大 span class token 性能优化压力测试数据分析

有关Fio工具详解【强大的IO性能压测工具】的更多相关文章

ruby - 如何验证 IO.copy_stream 是否成功 - 2
这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同，而不是下载一半的损坏文件？documentation说IO.copy_stream返回它复制的字节数，但是当我还没有下
Ruby 文件 IO 定界符？ - 2
我正在尝试解析一个文本文件，该文件每行包含可变数量的单词和数字，如下所示:foo4.500bar3.001.33foobar如何读取由空格而不是换行符分隔的文件？有什么方法可以设置File("file.txt").foreach方法以使用空格而不是换行符作为分隔符？最佳答案接受的答案将slurp文件，这可能是大文本文件的问题。更好的解决方案是IO.foreach.它是惯用的，将按字符流式传输文件:File.foreach(filename,""){|string|putsstring}包含“thisisanexample”结果的
世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2
无论您是想搭建桌面端、WEB端或者移动端APP应用，HOOPSPlatform组件都可以为您提供弹性的3D集成架构，同时，由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台（桌面/WEB/APP，而且某些客户端是“瘦”客户端）快速、方便地将数据接入到3D应用系统的解决方案，并且当访问数据时，在各个平台上的性能和用户体验保持一致，HOOPSPlatform将帮助您完成。利用HOOPSPlatform，您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品，HOOPSSDK包含的技术有：快速且准确的CAD
基于C#实现简易绘图工具【100010177】 - 2
C#实现简易绘图工具一.引言实验目的:通过制作窗体应用程序(C#画图软件),熟悉基本的窗体设计过程以及控件设计,事件处理等,熟悉使用C#的winform窗体进行绘图的基本步骤,对于面向对象编程有更加深刻的体会.Tutorial任务设计一个具有基本功能的画图软件**·包括简单的新建文件,保存,重新绘图等功能**·实现一些基本图形的绘制,包括铅笔和基本形状等,学习橡皮工具的创建**·设计一个合理舒适的UI界面**注明:你可能需要先了解一些关于winform窗体应用程序绘图的基本知识,以及关于GDI+类和结构的知识二.实验环境Windows系统下的visualstudio2017C#窗体应用程序三.
Get https://registry-1.docker.io/v2/: net/http: request canceled while waiting - 2
1.错误信息：Errorresponsefromdaemon:Gethttps://registry-1.docker.io/v2/:net/http:requestcanceledwhilewaitingforconnection(Client.Timeoutexceededwhileawaitingheaders)或者：Errorresponsefromdaemon:Gethttps://registry-1.docker.io/v2/:net/http:TLShandshaketimeout2.报错原因：docker使用的镜像网址默认为国外，下载容易超时，需要修改成国内镜像地址（首先阿里
postman接口测试工具-基础使用教程 - 2
1.postman介绍Postman一款非常流行的API调试工具。其实，开发人员用的更多。因为测试人员做接口测试会有更多选择，例如Jmeter、soapUI等。不过，对于开发过程中去调试接口，Postman确实足够的简单方便，而且功能强大。2.下载安装官网地址:https://www.postman.com/下载完成后双击安装吧，安装过程极其简单，无需任何操作3.使用教程这里以百度为例,工具使用简单，填写URL地址即可发送请求，在下方查看响应结果和响应状态码常用方法都有支持请求方法:getpostputdeleteGet、Post、Put与Delete的作用get：请求方法一般是用于数据查询，
ruby-on-rails - 有没有一种工具可以在编码时自动保存对文件的增量更改？ - 2
我最喜欢的Google文档功能之一是它会在我工作时不断自动保存我的文档版本。这意味着即使我在进行关键更改之前忘记在某个点进行保存，也很有可能会自动创建一个保存点。至少，我可以将文档恢复到错误更改之前的状态，并从该点继续工作。对于在MacOS(或UNIX)上运行的Ruby编码器，是否有具有等效功能的工具？例如，一个工具会每隔几分钟自动将Gitcheckin我的本地存储库以获取我正在处理的文件。也许我有点偏执，但这点小保险可以让我在日常工作中安心。最佳答案虚拟机有些人可能讨厌我对此的回应，但我在编码时经常使用VIM，它具有自动保存功
ruby - 为什么不能使用类IO的实例方法noecho？ - 2
print"Enteryourpassword:"pass=STDIN.noecho(&:gets)puts"Yourpasswordis#{pass}!"输出:Enteryourpassword:input.rb:2:in`':undefinedmethod`noecho'for#>(NoMethodError) 最佳答案一开始require'io/console'后来的Ruby1.9.3 关于ruby-为什么不能使用类IO的实例方法noecho？，我们在StackOverflow上
Ruby 的数字方法性能 - 2
我正在使用Ruby解决一些ProjectEuler问题，特别是这里我要讨论的问题25(Fibonacci数列中包含1000位数字的第一项的索引是多少？)。起初，我使用的是Ruby2.2.3，我将问题编码为:number=3a=1b=2whileb.to_s.length但后来我发现2.4.2版本有一个名为digits的方法，这正是我需要的。我转换为代码:whileb.digits.length当我比较这两种方法时，digits慢得多。时间./025/problem025.rb0.13s用户0.02s系统80%cpu0.190总计./025/problem025.rb2.19s用户0.0
ruby - Ruby 性能中的计时器 - 2
我正在寻找一个用ruby演示计时器的在线示例，并发现了下面的代码。它按预期工作，但这个简单的程序使用30Mo内存(如Windows任务管理器中所示)和太多CPU有意义吗？非常感谢deftime_blockstart_time=Time.nowThread.new{yield}Time.now-start_timeenddefrepeat_every(seconds)whiletruedotime_spent=time_block{yield}#Tohandle-vesleepinteravalsleep(seconds-time_spent)iftime_spent