面试官考点之什么情况下会索引失效?
面试官考点之简单说说你工作中遇到的索引失效场景?
以下索引失效的常见场景
1、like通配符,左侧开放情况下,全表扫描 2、or条件筛选,可能会导致索引失效 3、where中对索引列使用mysql的内置函数,一定失效 4、where中对索引列进行运算(如,+、-、*、/),一定失效 5、类型不一致,隐式的类型转换,导致的索引失效 6、where语句中索引列使用了负向查询,可能会导致索引失效。负向查询包括:NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等,其中:!< !> SQLServer语法。 7、索引字段可以为null,使用is null或is not null时,可能会导致索引失效 8、隐式字符编码转换导致的索引失效 9、联合索引中,where中索引列违背最左匹配原则,一定会导致索引失效 10、MySQL优化器的最终选择,不走索引我是肥哥,一名不专业的面试官! 我是囧囧,一名积极找工作的小菜鸟!
囧囧表示:小白面试最怕的就是面试官问的知识点太笼统,自己无法快速定位到关键问题点!!!
CREATE TABLE `t_user` (
`id` int(11) NOT NULL,
`user_name` varchar(32) CHARACTER DEFAULT NULL COMMENT '用户名',
`address` varchar(255) CHARACTER DEFAULT NULL COMMENT '地址',
`create_time` datetime DEFAULT NULL ON UPDATE CURRENT_TIMESTAMP COMMENT '创建时间',
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
插入1万条数据(注意:数据多些,mysql不走索引情况之一是数据量非常少,MySQL查询优化器认为全表扫描比使用索引更快,导致索引失效,explain检查是否使用索引时,发现无法走索引)
-- 创建存储过程,插入10000用户信息
CREATE PROCEDURE user_insert()
-- 定义存储过程开始
BEGIN
-- 定义变量 i ,int 类型,默认值为 1
DECLARE i INT DEFAULT 1;
WHILE i <= 10000
-- 定义循环内执行命令
DO INSERT INTO t_user(id, user_name, address, create_time) VALUES(i, CONCAT('mayun', i), CONCAT('浙江杭州', i), now());
SET i=i+1;
END WHILE;
COMMIT;
END;
-- 定义存储过程结束
-- 调用存储工程
CALL user_insert();
OR 连接的是同一个字段,相同走索引
explain select * from t_user where user_name = 'mayun10' or user_name = 'mayun1000'
OR 连接的是两个不同字段,不同索引失效
explain select * from t_user where user_name = 'mayun10' or address = '浙江杭州12'
给address列增加索引
alter table t_user add index idx_address (address)
OR 连接的是两个不同字段,如果两个字段皆有索引,走索引
验证总结
or 可能会导致索引失效,并非一定,这里涉及到MySQL index merge 技术。
1、MySQL5.0之前,查询时一个表一次只能使用一个索引,无法同时使用多个索引分别进行条件扫描。 2、但是从5.1开始,MySQL引入了 index merge 优化技术,对同一个表可以使用多个索引分别进行条件扫描。然后将它们各自的结果进行合并(intersect/union)。or索引生效有哪些情况? 第一种 or两边连接的是同一个索引字段 第二种 or两边连接的是两个索引字段,即两个字段分别都建立了索引
select * from t_user where user_name like '%mayun100%';
这条查询是否走索引?
select * from t_user where user_name like 'mayun100%';
这条查询是否走索引?
验证总结
like 通配符特性是可以左右开闭匹配查询
当左边开放使用 % 或者 _ 匹配的时候都不会走索引,会进行全表扫描
为什么左开情况下会索引失效?请介绍一下原理!我们知道建立索引后,MySQL会建立一棵有序的B+Tree,索引树是有序的,索引列进行查询匹配时是从左到右进行匹配。使用 % 和 _ 匹配,这表示左边匹配值是不确定的。不确定,意味着充满可能,怎么比较? 当然只能一个一个的比较,那就相当于,全匹配了,全匹配在优化器看来,与其走索引树查询,再进行不断的回表操作,还不如直接进行全表扫描划算!
建立 idx_age 索引,
alter table t_user add index idx_age(age);
不使用内置函数
explain select * from t_user where age = 80
使用内置函数
explain select * from t_user where abs(age) = 80
验证总结
如果对索引字段做了函数操作,可能会破坏索引值的有序性,因此优化器就决定放弃走树搜索功能。 MySQL 无法再使用索引快速定位功能,而只能使用全索引扫描。
不涉及索引列的运算
alter table t_user add index idx_age(age);
explain select * from t_user where age = 80;
索引列进行运算操作
explain select * from t_user where age + 5 = 80
alter table t_user add index idx_user_name(user_name);
explain select * from t_user where user_name = 'mayun1';
修改数据,再次explain
update t_user set user_name = '100' where user_name = 'mayun1';
explain select * from t_user where user_name = 100;
user_name = 100 ,因为user_name 字段定义的是varchar,索引在where进行匹配时会先隐式调用 case() 函数进行类型转换 将匹配条件变成,user_name = '100'
负向查询包括:NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等,其中:!< !> SQLServer语法。
alter table t_user add index idx_age(age);
explain select * from t_user where age in (100, 50);
explain select * from t_user where age not in (100, 50);
explain select * from t_user where user_name is null;
explain select * from t_user where user_name is not null;
第二种情况,表结构规定user_name 字段不可以为null
explain select * from t_user where user_name is null;
explain select * from t_user where user_name is not null;
如果读者复现到此场景,欢迎评论讨论或关注如果读者复现到此场景,欢迎评论或关注公众号囧么肥事讨论
创建联合做引 idx_user_name_deposit, 遵循最左匹配原则
alter table t_user add index idx_user_name_deposit(user_name, deposit);
explain select * from t_user where user_name like 'mayun86%'
遵循最左匹配之 a b 类型
explain select * from t_user where user_name like 'mayun86%' and deposit = 5620.26;
调换索引位置,测试联合索引书写规则
explain select * from t_user where deposit = 5620.26 and user_name like 'mayun86%';
违反最左匹配原则
explain select * from t_user where deposit = 5620.26;
验证总结
联合索引依据最左匹配原则建立索引树,在查询时依据联合索引顺序依次匹配索引值,查询时如果违背最左匹配原则,将导致索引失效。
假设建立索引 idx_a_b_c,相当于建立了 (a), (a,b), (a,b,c)三个索引
查询匹配时匹配顺序是 a b c
查询时如果没有 a 字段筛选,那么索引将失效
举栗子,走索引情况
select * from test where a=1
select * from test where a=1 and b=2
select * from test where a=1 and b=2 and c=3
索引失效呢?
select * from test where b=2 and c=3
联合索引如果要走索引,查询条件中必须要包含第一个索引,否则索引失效
select * from test where b=1 and a=1
select * from test where m='222' and a=1
这两条查询走索引的原因是什么?
最左前缀指的是查询时匹配索引列要按照联合索引创建的顺序,但是在书写时不需要严格按照联合索引创建的顺序,MySQL优化器会自动调整,所以上面两条查询索引有效!
explain select * from t_user where age > 59;
explain select * from t_user where age > 99;
验证总结
MySQL查询索引失效的情况有很多,即使其他情况都规避,但是在经过了优化器的确定查询方案的时候,依然可能索引失效。
优化器会考虑查询成本,来确认它认为的最佳方案来执行查询
当数据量较少,或者需要访问行很多的时候
优化器会认为走索引树来进行回表,还不如直接进行全表扫描的时候,优化器将会抛弃走索引树。
HashMap中为什么引入红黑树,而不是AVL树呢1.概述开始学习这个知识点之前我们需要知道,在JDK1.8以及之前,针对HashMap有什么不同。JDK1.7的时候,HashMap的底层实现是数组+链表JDK1.8的时候,HashMap的底层实现是数组+链表+红黑树我们要思考一个问题,为什么要从链表转为红黑树呢。首先先让我们了解下链表有什么不好???2.链表上述的截图其实就是链表的结构,我们来看下链表的增删改查的时间复杂度增:因为链表不是线性结构,所以每次添加的时候,只需要移动一个节点,所以可以理解为复杂度是N(1)删:算法时间复杂度跟增保持一致查:既然是非线性结构,所以查询某一个节点的时候
我发现自己需要这个。假设cart是一个包含用户列表的模型。defindex_of_itemcart.users.each_with_indexdo|u,i|ifu==current_userreturniendend获取此类关联索引的更简单方法是什么? 最佳答案 indexArray上的方法与您的index_of_item方法相同,例如cart.users.index(current_user)返回数组中第一个对象的索引==给obj。如果未找到匹配项,则返回nil。 关于ruby-on-
因此,当我遵循MichaelHartl的RubyonRails教程时,我注意到在用户表中,我们为:email属性添加了一个唯一索引,以提高find的效率方法,因此它不会逐行搜索。到目前为止,我们一直在根据情况使用find_by_email和find_by_id进行搜索。然而,我们从未为:id属性设置索引。:id是否自动索引,因为它在默认情况下是唯一的并且本质上是顺序的?或者情况并非如此,我应该为:id搜索添加索引吗? 最佳答案 大多数数据库(包括sqlite,这是RoR中的默认数据库)会自动索引主键,对于RailsMigration
假设我有一个可枚举对象enum,现在我想获取第三个项目。我知道一种通用方法是转换成数组,然后使用索引访问,如:enum.to_a[2]但这种方式会创建一个临时数组,效率可能很低。现在我使用:enum.each_with_index{|v,i|breakvifi==2}但这非常丑陋和多余。执行此操作最有效的方法是什么? 最佳答案 你可以使用take剥离前三个元素,然后剥离last从take给你的数组中获取第三个元素:third=enum.take(3).last如果您根本不想生成任何数组,那么也许:#Ifenumisn'tanEnum
在我的场景中,Logstash收到的系统日志行的“时间戳”是UTC,我们在Elasticsearch输出中使用事件“时间戳”:output{elasticsearch{embedded=>falsehost=>localhostport=>9200protocol=>httpcluster=>'elasticsearch'index=>"syslog-%{+YYYY.MM.dd}"}}我的问题是,在UTC午夜,Logstash在外时区(GMT-4=>America/Montreal)结束前将日志发送到不同的索引,并且索引在20小时(晚上8点)之后没有日志,因为“时间戳”是UTC。我们已
我想从特定索引开始遍历数组。我该怎么做?myj.eachdo|temp|...end 最佳答案 执行以下操作:your_array[your_index..-1].eachdo|temp|###end 关于ruby-从特定索引开始迭代数组,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/44151758/
我一直在努力学习如何处理由数组组成的数组。假设我有这个数组:my_array=[['ORANGE',1],['APPLE',2],['PEACH',3]我将如何找到包含'apple'的my_array索引并删除该索引(删除子数组['APPLE',2]因为'apple'包含在该索引的数组中)?谢谢-我非常感谢这里的帮助。 最佳答案 您可以使用Array.select过滤掉项目:>>a=[['ORANGE',1],['APPLE',2],['PEACH',3]]=>[["ORANGE",1],["APPLE",2],["PEACH",3
我想使用部分字符串搜索数组,然后获取找到该字符串的索引。例如:a=["Thisisline1","Wehaveline2here","andfinallyline3","potato"]a.index("potato")#thisreturns3a.index("Wehave")#thisreturnsnil使用a.grep将返回完整的字符串,使用a.any?将返回正确的true/false语句,但都不会返回匹配的索引找到了,或者至少我不知道该怎么做。我正在编写一段代码,该代码读取文件、查找特定header,然后返回该header的索引,以便它可以将其用作future搜索的偏移量。如果
如何在rakedb:migrate:status中删除带有“**NOFILE**”的迁移ID列表?例如:StatusMigrationIDMigrationName--------------------------------------------------up20131017204224Createusersup20131218005823**********NOFILE**********up20131218011334**********NOFILE**********我不明白为什么当我自己手动删除它时它仍然保留旧的迁移文件,因为我正在研究迁移的工作原理。这是为了记录吗?但
西安华为OD面试体验开始投简历技术面试进展工作进展开始投简历去年一整年一直在考研和工作之间纠结,感觉自己的状态好像当时的疫情一样差劲。之前刚毕业的时候投了个大厂的简历,结果一面写算法的时候太拉跨了,虽然知道时dfs但是代码熟练度不够,放在平时给足时间自己可以调试通过,但是熟练度不够那面试当时就写不出来被刷了。说真的算法学到后期我感觉最重要的是熟练度和背板子(对于我这种普通玩家来说),面试题如果一上来短时间内想不出思路就完蛋了。然后由于当时找的工作不是很理想就又想考研了。但是考研是有风险的,我自我感觉自己可能冲不上那个学校,而找工作一个没成可以继续找嘛。本着抱着试试看的态度在boss上投了简历,