慢SQL，压垮团队的最后一根稻草！

码农小宋 2023-03-28 原文

一、什么是慢 SQL

什么是慢SQL？顾名思义，运行时间较长的 SQL 语句即为慢 SQL！

那问题来了，多久才算慢呢？

这个慢其实是一个相对值，不同的业务场景下，标准要求是不一样的。

我们都知道，我们每执行一次 SQL，数据库除了会返回执行结果以外，还会返回 SQL 执行耗时，以 MySQL 数据库为例，当我们开启了慢 SQL 监控开关后，默认配置下，当 SQL 的执行时长大于 10 秒，会被记录到慢 SQL 的日志文件中。

当然，这个值还可以重新设置，生产环境慢 SQL 一般会设置为0.1~0.2s。当我们将其设置为0.2s时，当前数据库所有 SQL 的执行时长超过0.2s的都会被视为慢 SQL。

可能有的同学会发出疑问，我们为什么要追踪慢 SQL，有什么意义呢？

二、慢 SQL 危害

这里要从慢 SQL 的危害谈起，以 MySQL 数据库为例，总结起来有以下几点：

当出现慢查询，DDL 操作都会被阻塞，也就是说创建表、修改表、删除表、执行数据备份等操作都需要等待，这对实时备份重要数据的系统来说是不可容忍的
慢查可能会占用 mysql 的大量内存，严重的时候会导致服务器直接挂掉，整个系统直接瘫痪
慢 SQL 的执行时间过长，可能会导致应用的进程因超时被 kill，无法返回结果给到客户端
造成数据库幻读、不可重复读的概率更大，假设该慢 SQL 是一个更新操作但因执行时间过长未提交，而另一条 SQL 也在更新数据并且已提交，用户再次查询的时候，看到的数据可能与实际结果不符
严重影响用户体验，SQL 的执行时间越长，页面加载数据耗时也就越长

以千万级的订单表为例，未优化的情况下，单表分页查询 10 条数据，耗时：39s

首先不说可能对数据库服务器造成的潜在压力，没有任何一个用户会在页面查询订单查询等待 39 秒！

三、如何定位慢 SQL

说了这么多，我们如何去定位慢 SQL 呢？

3.1、开启慢 SQL 监控

以 MySQL 为例，我们可以通过如下方式，查询是否开启慢 SQL 的监控。

show variables like 'slow_query_log%';

通过如下命令，开启慢 SQL 监控，执行成功之后，客户端需要重新连接才能生效。

-- 开启慢 SQL 监控
set global slow_query_log = 1;

如果想关闭慢 SQL 监控，将其配置为0就可以了。

-- 关闭慢 SQL 监控
set global slow_query_log = 0;

需要特别注意的是，当服务器重启之后，当前配置会失效！

3.2、配置慢 SQL 阀值

默认的慢 SQL 阀值是10秒，可以通过如下语句查询慢 SQL 的阀值。

-- 查询慢 SQL 的阀值
show variables like "long_query_time";

我们可以通过如下方式，将慢 SQL 阀值配置成0.2秒。

-- 修改慢 SQL 的阀值
set global long_query_time = 0.2;

然后，退出客户端，重新连接服务器，就生效了！

与之类似，当服务器重启之后，当前配置会失效！

3.3、永久开启慢 SQL 监控

以上的操作，当服务器不重启会一直有效，但是当服务器一单重启之后，配置就会失效，如果想永久生效，可以通过修改全局配置文件my.cnf使之永久生效。

以 CentOS 为例，打开my.cnf配置文件，添加如下配置变量。

[mysqld]
slow_query_log = ON
slow_query_log_file = /var/lib/mysql/ecs-203056-slow.log
long_query_time = 1

重启 mysql 服务器

systemctl restart mysqld

3.4、慢 SQL 监控测试

初始化一张日志表，数据量在 10 万左右就够了，然后我们来执行 SQL，看看是不是被正常抓取到。

很清晰的看到，慢 SQL 已经被抓取记录。

日志内容详解：

Time：表示客户端查询时间
root[root]：表示客户端查询用户和IP
Query_time：表示查询耗时
Lock_time：表示等待 table lock 的时间，注意InnoDB的行锁等待是不会反应在这里的
Rows_sent：表示返回了多少行记录（结果集）。
Rows_examined：表示检查了多少条记录。

除此之外，我们还可以借助mysqldumpslow命令工具，分析慢 SQL 的数据情况，可以通过如下参数进行组合分析

-s         表示按何种方式排序，支持的参数如下
            al: 平均锁定时间
            ar: 平均返回记录数
            at: 平均查询时间
            c: 访问次数
            l: 锁定时间
            r: 返回记录
            t: 查询时间
-t NUM       返回前面多少条的数据
-g PATTERN   后边搭配一个正则匹配模式，大小写不敏感

常见的用法如下：

查询返回记录集最多的10个 SQL

mysqldumpslow -s r -t 10 /var/lib/mysql/ecs-203056-slow.log

查询访问次数最多的10个SQL

mysqldumpslow -s c -t 10 /var/lib/mysql/ecs-203056-slow.log

查询按照时间排序的前10条里面含有左连接的查询语句

mysqldumpslow -s t -t 10 -g "LEFT JOIN" /var/lib/mysql/ecs-203056-slow.log

四、慢 SQL 是怎么发生的

面对这种耗时巨长的 SQL，我们不禁会发出一个疑问，它是怎么发生的呢？

这得从 SQL 的执行过程说起，我们先简单的看看下面这个图。

一条 SQL 语句执行时，总结起来大概分为以下几个步骤：

1.若查询缓存打开则会优先查询缓存，若命中则直接返回结果给客户端。
2.若缓存未命中，此时 MySQL 需要搞清楚这条语句需要做什么，则通过分析器进行词法分析、语法分析。
3.搞清楚要做什么之后，MySQL 会通过优化器对 SQL 进行优化，生成一个最优的执行计划
4.最后通过执行器与存储引擎提供的接口进行交互，将结果返回给客户端

在 MySQL 执行过程中，优化器可能会对我们即将要执行的 SQL 进行改造，改造思路如下：

1.根据搜索条件，找出 SQL 中所有可能使用的索引
2.然后计算全表扫描的成本开销
3.接着计算使用不同索引执行查询的成本开销
4.最后会对比各种执行方案的成本开销，找出开销值最小的那一个

其中影响成本开销值的计算，主要是I/O成本和CPU成本这两个指标。

从I/O成本视角看：

当表的数据量越大，需要的 I/O 次数也就越多
从磁盘读取数据比从缓存读取数据，I/O 消耗的时间更多
全表扫描比通过索引快速查找，I/O 消耗的时间和次数更多

从CPU成本视角看：

当 SQL 中有排序、子查询等复杂的操作时，CPU 需要先把数据存到临时表中，再对数据进行加工，需要的 CPU 资源更多
全表扫描相比于通过索引快速查找，需要的 CPU 资源也更多

因此我们不难发现，在没有开启缓存的情况下，当表的数据量越大，如果 SQL 又没有走索引，很容易发生查询慢的问题。

五、小结

本文主要围绕慢 SQL 的定位和可能存在的风险进行了简单的介绍，整篇介绍的算是一个入门级的知识，文章内容难免有些理解不到位的地方，欢迎网友留言指出！

由于篇幅的原因，我们会在下篇文章中介绍慢 SQL 的优化思路。

压垮 SQL span style section sql mysql 数据MySQL 数据库yyds干货盘点

有关慢SQL，压垮团队的最后一根稻草！的更多相关文章

Hive SQL 五大经典面试题 - 2
目录第1题连续问题分析：解法：第2题分组问题分析：解法：第3题间隔连续问题分析：解法：第4题打折日期交叉问题分析：解法：第5题同时在线问题分析：解法：第1题连续问题如下数据为蚂蚁森林中用户领取的减少碳排放量iddtlowcarbon10012021-12-1212310022021-12-124510012021-12-134310012021-12-134510012021-12-132310022021-12-144510012021-12-1423010022021-12-154510012021-12-1523.......找出连续3天及以上减少碳排放量在100以上的用户分析：遇到这类
sql - 查询忽略时间戳日期的时间范围 - 2
我正在尝试查询我的Rails数据库(Postgres)中的购买表，我想查询时间范围。例如，我想知道在所有日期的下午2点到3点之间进行了多少次购买。此表中有一个created_at列，但我不知道如何在不搜索特定日期的情况下完成此操作。我试过:Purchases.where("created_atBETWEEN?and?",Time.now-1.hour,Time.now)但这最终只会搜索今天与那些时间的日期。最佳答案您需要使用PostgreSQL'sdate_part/extractfunction从created_at中提取小时
ruby - Hanami link_to 助手只呈现最后一个元素 - 2
我是HanamiWorld的新人。我已经写了这段代码:moduleWeb::Views::HomeclassIndexincludeWeb::ViewincludeHanami::Helpers::HtmlHelperdeftitlehtml.headerdoh1'Testsearchengine',id:'title'hrdiv(id:'test')dolink_to('Home',"/",class:'mnu_orizontal')link_to('About',"/",class:'mnu_orizontal')endendendendend我在模板上调用了title方法。htm
ruby - 如果它是标点符号，我怎么能从字符串中删除最后一个字符，在 ruby 中？ - 2
啊，正则表达式有点困惑。我正在尝试删除字符串末尾所有可能的标点符号:ifstr[str.length-1]=='?'||str[str.length-1]=='.'||str[str.length-1]=='!'orstr[str.length-1]==','||str[str.length-1]==';'str.chomp!end我相信有更好的方法来做到这一点。有什么指点吗？最佳答案 str.sub!(/[?.!,;]?$/,'')[?.!,;]-字符类。匹配这5个字符中的任何一个(注意，。在字符类中并不特殊)?-前一个字符或组
Ruby - 删除文件中的最后一个字符？ - 2
看起来一定很简单，但我就是想不通。如何使用RubyIO删除文件的最后一个字符？我查看了deletingthelastlineofafile的答案使用Ruby但没有完全理解它，必须有更简单的方法。有什么帮助吗？最佳答案有File.truncate:truncate(file_name,integer)→0Truncatesthefilefile_nametobeatmostintegerbyteslong.Notavailableonallplatforms.所以你可以这样说:File.truncate(file_name,Fil
sql - 在 Rails Console for PostgreSQL 的表中显示数据 - 2
我找到了这样的东西:Rails:Howtolistdatabasetables/objectsusingtheRailsconsole?这一行没问题:ActiveRecord::Base.connection.tables并返回所有表但是ActiveRecord::Base.connection.table_structure("users")产生错误:ActiveRecord::Base.connection.table_structure("projects")我认为table_structure不是Postgres方法。如何列出Postgres数据库的Rails控制台中表中的所有
ruby-on-rails - Ruby on Rails 的最后 20% - 2
我是(相当)一位经验丰富的程序员，但对Ruby和RubyonRails完全陌生。RoR看起来很适合快速工作，特别是用于CRUD操作的自动屏幕生成。它确实能让您快速提高工作效率。问题是最后20%的工作，那时我必须完成我的申请。RoR公约不会妨碍我吗？因为不是每个数据库表都必须对所有用户可用，也不是所有用户都可以编辑所有列和/或所有行，而且View必须适应我网站的外观等。我知道RoR已成功用于现场，但在第一阶段烧毁后，如何在RoR中获得足够的速度以逃避重力。最佳答案我认为脚手架无法让您达到80%。脚手架很好，因为它向您展示了Rail
ruby - 防止SQL注入(inject)/好的Ruby方法 - 2
Ruby中防止SQL注入(inject)的好方法是什么？最佳答案直接使用ruby？使用准备好的语句:require'mysql'db=Mysql.new('localhost','user','password','database')statement=db.prepare"SELECT*FROMtableWHEREfield=?"statement.execute'value'statement.fetchstatement.close 关于ruby-防止SQL注入(inject
arrays - 在一行中选择数组的第一个和最后一个元素 - 2
我的任务是从数组中选择最高和最低的数字。我想我很清楚我想做什么，但只是努力以正确的格式访问信息以满足通过标准。defhigh_and_low(numbers)array=numbers.split("").map!{|x|x.to_i}array.sort!{|a,b|ba}putsarray[0,-1]end数字可能看起来像"80917234100"，要通过，我需要输出"9234"。我正在尝试putsarray.first.last，但一直无法弄明白。最佳答案有Array#minmax完全满足您需要的方法:array=[80,
ruby-on-rails - 如何在 Rails 中的不同数据库上执行直接 SQL 代码 - 2
我正在编写一个Rails应用程序，它将监视某些特定数据库的数据质量。为了做到这一点，我需要能够对这些数据库执行直接SQL查询——这当然与用于驱动Rails应用程序模型的数据库不同。简而言之，这意味着我无法使用通过ActiveRecord基础连接的技巧。我需要连接的数据库在设计时是未知的(即:我不能将它们的详细信息放在database.yaml中)。相反，我有一个模型“database_details”，用户将使用它来输入应用程序将在运行时执行查询的数据库的详细信息。因此与这些数据库的连接实际上是动态的，细节仅在运行时解析。最佳答案