我想在表 T 中查询由某些列 x 标识的行。应返回行的 x 的值由表 U 上的某些子查询确定,该表携带列 a 上的实际过滤条件(一个短字符串)和 b(一个时间戳值,寻找一个范围)。
SELECT * FROM T
WHERE x IN (
SELECT x FROM U WHERE a = ? AND b BETWEEN ? AND ?
)
ORDER BY x, y
表 T 和 U 都很大(在 1M..100M 行的范围内)。他们的定义在问题的最后。在典型的用例中,x 的大约 100 个不同值的结果集中有大约 500 到 1000 行。 x 的这些值不是连续的,而且确实非常“随机”。
这个查询需要相当长的时间(在 0.5 到 2 秒的范围内),尽管使用了表 T 和 U 的正确索引,实际上只有一个根据慢速查询日志,正在“检查”少量行(大约 1000 行)。
索引定义为:
U 表上的索引 idx_u 覆盖了 WHERE 子句中的列(a,b ).T 上的索引 idx_t 涵盖列 x(用于查找 行)和 y(用于次要顺序标准)。上述查询的EXPLAIN是:
id select_type table type possible_keys key key_len ref rows Extra
1 SIMPLE U range idx_u idx_u 24 NULL 107 Using where; Using index; Using temporary; Using filesort
1 SIMPLE T ref idx_t idx_t 8 U.x 4 NULL
我还尝试了 JOIN 而不是子查询:
SELECT * FROM T
JOIN U ON T.x = U.x
WHERE a = ? AND b BETWEEN ? AND ?
ORDER BY T.x, T.y
EXPLAIN 的内容与上面完全相同。
但是,当单独执行子查询并按字面列出 x 的值时,两个查询一起花费的时间要少得多(在 10 到 20 毫秒的范围内)。此外,他们的 EXPLAIN 看起来不一样。
第一个查询(原来是子查询):
SELECT x FROM U WHERE a = ? AND b BETWEEN ? AND ?
它的 EXPLAIN 匹配上面的第一个条目:
id select_type table type possible_keys key key_len ref rows Extra
1 SIMPLE U range idx_u idx_u 24 NULL 107 Using where; Using index; Using temporary; Using filesort
现在是第二个查询:
SELECT * FROM T
WHERE x IN (
3917,8525,13149,17729,22355,26908,31457,36053,40663,45250 -- ... (64 values here)
)
ORDER BY x, y
解释为
id select_type table type possible_keys key key_len ref rows Extra
1 SIMPLE T range idx_t idx_t 8 U.x 436 Using index condition
现在我注意到在原始(组合)查询中,对于表 T,行数的猜测只有 4,这太低了。此外,T 的类型是 ref,而在单独的查询中(x 具有显式值),它是 range.
T 中查找的错误猜测行号是否会导致查询以次优方式执行? ref 类型是造成巨大性能差异的原因吗?
最后,要解决这个问题,我可以强制 range 吗?请注意,这并不是强制使用索引,因为它似乎已经被使用了。
编辑:表格是这样创建的:
CREATE TABLE `U` (
`x` bigint(20) UNSIGNED NOT NULL AUTO_INCREMENT,
`a` varchar(20) CHARACTER SET ascii NOT NULL,
`b` timestamp NOT NULL DEFAULT '0000-00-00 00:00:00',
-- (more columns irrelevant here)
) ENGINE=InnoDB;
ALTER TABLE `U`
ADD PRIMARY KEY (`x`),
ADD KEY `idx_u` (`a`,`b`) USING BTREE;
CREATE TABLE `T` (
`id` bigint(20) UNSIGNED NOT NULL AUTO_INCREMENT,
`x` bigint(20) UNSIGNED NOT NULL,
`y` int(11) UNSIGNED NOT NULL,
-- (more columns irrelevant here)
) ENGINE=InnoDB;
ALTER TABLE `T`
ADD PRIMARY KEY (`id`),
ADD KEY `idx_t` (`x`,`y`) USING BTREE;
最佳答案
如果您将查询更改为使用 WHERE EXISTS 而不是 IN 运算符,并且因为您已经尝试过 JOIN 转换
SELECT * FROM T
WHERE EXISTS (SELECT 1 FROM U WHERE T.x = U.x
AND a = ?
AND b BETWEEN ? AND ?
)
ORDER BY x, y;
奇怪的是,我看到你在 x,y(ADD KEY idx_t (x,y) USING BTREE) 上有一个索引,但你的解释表明它正在执行一个文件排序 Using where;使用索引;使用文件排序
关于mysql - 巨大的性能差异 : "WHERE x IN (...values...)" vs. "WHERE x IN (<subquery>)",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40995158/
我正在尝试测试是否存在表单。我是Rails新手。我的new.html.erb_spec.rb文件的内容是:require'spec_helper'describe"messages/new.html.erb"doit"shouldrendertheform"dorender'/messages/new.html.erb'reponse.shouldhave_form_putting_to(@message)with_submit_buttonendendView本身,new.html.erb,有代码:当我运行rspec时,它失败了:1)messages/new.html.erbshou
我在从html页面生成PDF时遇到问题。我正在使用PDFkit。在安装它的过程中,我注意到我需要wkhtmltopdf。所以我也安装了它。我做了PDFkit的文档所说的一切......现在我在尝试加载PDF时遇到了这个错误。这里是错误:commandfailed:"/usr/local/bin/wkhtmltopdf""--margin-right""0.75in""--page-size""Letter""--margin-top""0.75in""--margin-bottom""0.75in""--encoding""UTF-8""--margin-left""0.75in""-
在railstutorial中,作者为什么选择使用这个(代码list10.25):http://ruby.railstutorial.org/chapters/updating-showing-and-deleting-usersnamespace:dbdodesc"Filldatabasewithsampledata"task:populate=>:environmentdoRake::Task['db:reset'].invokeUser.create!(:name=>"ExampleUser",:email=>"example@railstutorial.org",:passwo
我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据,就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理?我没有在文档中找到任何内容。 最佳答案 我遇到了同样的问题;这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML,但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中,将我的XML代码修改为
为了将Cucumber用于命令行脚本,我按照提供的说明安装了arubagem。它在我的Gemfile中,我可以验证是否安装了正确的版本并且我已经包含了require'aruba/cucumber'在'features/env.rb'中为了确保它能正常工作,我写了以下场景:@announceScenario:Testingcucumber/arubaGivenablankslateThentheoutputfrom"ls-la"shouldcontain"drw"假设事情应该失败。它确实失败了,但失败的原因是错误的:@announceScenario:Testingcucumber/ar
关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗?通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion在首页我有:汽车:VolvoSaabMercedesAudistatic_pages_spec.rb中的测试代码:it"shouldhavetherightselect"dovisithome_pathit{shouldhave_select('cars',:options=>['volvo','saab','mercedes','audi'])}end响应是rspec./spec/request
我遵循MichaelHartl的“RubyonRails教程:学习Web开发”,并创建了检查用户名和电子邮件长度有效性的测试(名称最多50个字符,电子邮件最多255个字符)。test/helpers/application_helper_test.rb的内容是:require'test_helper'classApplicationHelperTest在运行bundleexecraketest时,所有测试都通过了,但我看到以下消息在最后被标记为错误:ERROR["test_full_title_helper",ApplicationHelperTest,1.820016791]test
我正在尝试从Postgresql表(table1)中获取数据,该表由另一个相关表(property)的字段(table2)过滤。在纯SQL中,我会这样编写查询:SELECT*FROMtable1JOINtable2USING(table2_id)WHEREtable2.propertyLIKE'query%'这工作正常:scope:my_scope,->(query){includes(:table2).where("table2.property":query)}但我真正需要的是使用LIKE运算符进行过滤,而不是严格相等。然而,这是行不通的:scope:my_scope,->(que
我正在尝试编写一个将文件上传到AWS并公开该文件的Ruby脚本。我做了以下事情:s3=Aws::S3::Resource.new(credentials:Aws::Credentials.new(KEY,SECRET),region:'us-west-2')obj=s3.bucket('stg-db').object('key')obj.upload_file(filename)这似乎工作正常,除了该文件不是公开可用的,而且我无法获得它的公共(public)URL。但是当我登录到S3时,我可以正常查看我的文件。为了使其公开可用,我将最后一行更改为obj.upload_file(file
当我尝试安装Ruby时遇到此错误。我试过查看this和this但无济于事➜~brewinstallrubyWarning:YouareusingOSX10.12.Wedonotprovidesupportforthispre-releaseversion.Youmayencounterbuildfailuresorotherbreakages.Pleasecreatepull-requestsinsteadoffilingissues.==>Installingdependenciesforruby:readline,libyaml,makedepend==>Installingrub