mysql - SELECT DISTINCT(column) FROM table on an indexed column 的计算复杂度

coder 2023-10-21 原文

问题

我不是 comp sci 专业的，所以如果我混淆了术语，请原谅我。调用的计算复杂度是多少

 SELECT DISTINCT(column) FROM table

或

SELECT * FROM table GROUP BY column

在被索引的列上？它与行数或列中不同值的数量成正比。我相信这将是 O(1)*NUM_DISINCT_COLS 与 O(NUM_OF_ROWS)

背景

例如，如果我有 1000 万行，但在视觉上该列中只有 10 个不同的值/组，您可以简单地计算每个组中的最后一项，这样时间复杂度将与不同组的数量而不是行。因此，计算 100 万行和计算 100 行所花费的时间相同。我相信复杂度将是

O(1)*Number_Of_DISTINCT_ELEMENTS

但在 MySQL 的情况下，如果我有 10 个不同的组，MySQL 仍然会遍历每一行，基本上计算每个组的运行，或者它是否以一组具有相同值的行的方式设置可以在 O(1) 时间内计算每个不同的列值吗？如果不是，那么我相信这意味着复杂性是

O(NUM_ROWS)

我为什么要关心？

我的站点中有一个页面列出了消息类别的统计信息，例如未读总数、消息总数等。我可以使用 GROUP BY 和 SUM() 来计算这些信息 但我的印象是，随着消息数量的增加，这会花费更长的时间，所以我有一个每个类别的统计表。当发送或创建新消息时，我会增加 total_messages 字段。当我想查看状态页面时，我只需选择一行

SELECT total_unread_messages FROM stats WHERE category_id = x

而不是使用 GROUP BY 和/或 DISINCT 计算所有消息的实时统计数据。

在我的情况下，这两种方式对性能的影响都不大，所以这看起来像是“过早优化”的情况，但很高兴知道我什么时候做的事情是可扩展的或不可扩展的到不需要花费太多时间构建的其他选项。

最佳答案

如果你正在做:

select distinct column
from table

并且列上有一个索引，然后MySQL可以使用“松散索引扫描”(描述为here)来处理这个查询。

这应该允许引擎从索引中读取一个键，然后“跳转”到下一个键而不读取中间键(它们都是相同的)。这表明该操作不需要读取整个索引，因此通常小于 O(n)(其中 n = 表中的行数).

我怀疑找到下一个值只需要一次操作。如果整体复杂性类似于 O(m * log(n))，我不会感到惊讶，其中 m = 不同值的数量。

关于mysql - SELECT DISTINCT(column) FROM table on an indexed column 的计算复杂度，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18387819/

有关mysql - SELECT DISTINCT(column) FROM table on an indexed column 的计算复杂度的更多相关文章

ruby-on-rails - 使用一系列等级计算字母等级 - 2
这里是Ruby新手。完成一些练习后碰壁了。练习:计算一系列成绩的字母等级创建一个方法get_grade来接受测试分数数组。数组中的每个分数应介于0和100之间，其中100是最大分数。计算平均分并将字母等级作为字符串返回，即“A”、“B”、“C”、“D”、“E”或“F”。我一直返回错误:avg.rb:1:syntaxerror,unexpectedtLBRACK,expecting')'defget_grade([100,90,80])^avg.rb:1:syntaxerror,unexpected')',expecting$end这是我目前所拥有的。我想坚持使用下面的方法或.join，
ruby - 多个属性的 update_column 方法 - 2
我有一个具有一些属性的模型:attr1、attr2和attr3。我需要在不执行回调和验证的情况下更新此属性。我找到了update_column方法，但我想同时更新三个属性。我需要这样的东西:update_columns({attr1:val1,attr2:val2,attr3:val3})代替update_column(attr1,val1)update_column(attr2,val2)update_column(attr3,val3) 最佳答案您可以使用update_columns(attr1:val1,attr2:val2
使用canal同步MySQL数据到ES - 2
文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目，Java开发。基于数据库增量日志解析，提供增量数据订阅&消费。Git地址：https://github.co
计算机毕业设计ssm+vue基本微信小程序的小学生兴趣延时班预约小程序 - 2
项目介绍随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱小学生兴趣延时班预约小程序的设计与开发被用户普遍使用,为方便用户能够可以随时进行小学生兴趣延时班预约小程序的设计与开发的数据信息管理,特开发了小程序的设计与开发的管理系统。小学生兴趣延时班预约小程序的设计与开发的开发利用现有的成熟技术参考,以源代码为模板,分析功能调整与小学生兴趣延时班预约小程序的设计与开发的实际需求相结合,讨论了小学生兴趣延时班预约小程序的设计与开发的使用。开发环境开发说明：前端使用微信微信小程序开发工具：后端使用ssm：VU
ruby - 如何计算 Liquid 中的变量 +1 - 2
我对如何计算通过{%assignvar=0%}赋值的变量加一完全感到困惑。这应该是最简单的任务。到目前为止，这是我尝试过的:{%assignamount=0%}{%forvariantinproduct.variants%}{%assignamount=amount+1%}{%endfor%}Amount:{{amount}}结果总是0。也许我忽略了一些明显的东西。也许有更好的方法。我想要存档的只是获取运行的迭代次数。最佳答案因为{{incrementamount}}将输出您的变量值并且不会影响{%assign%}定义的变量，我
ruby - 导轨 4 : column reference "updated_at" is ambiguous with Postgres - 2
我正在尝试使用“updated_at”字段的日期时间范围查询数据库。前端在JSON数组中发送查询:["2015-09-0100:00:00","2015-10-0223:00:00"]在RailsController中，我使用以下方法将两个字符串解析为DateTime:start_date=DateTime.parse(params[:date_range_arr][0])end_date=DateTime.parse(params[:date_range_arr][1])#...@events=@events.where('updated_atBETWEEN?AND?,start_d
ruby - 使用 Ruby，计算 n x m 数组的每一列中有多少个 true 的简单方法是什么？ - 2
给定一个nxmbool数组:[[true,true,false],[false,true,true],[false,true,true]]有什么简单的方法可以返回“该列中有多少个true？”结果应该是[1,3,2] 最佳答案使用转置得到一个数组，其中每个子数组代表一列，然后将每一列映射到其中的true数:arr.transpose.map{|subarr|subarr.count(true)}这是一个带有inject的版本，应该在1.8.6上运行，没有任何依赖:arr.transpose.map{|subarr|subarr.in
ruby-on-rails - 无法安装 mysql2 0.3.14 gem - 2
我看到其他人也遇到过类似的问题，但没有一个解决方案对我有用。0.3.14gem与其他gem文件一起存在。我已经完全按照此处指示完成了所有操作:https://github.com/brianmario/mysql2.我仍然得到以下信息。我不知道为什么安装程序指示它找不到include目录，因为我已经检查过它存在。thread.h文件存在，但不在ruby目录中。相反，它在这里:C:\RailsInstaller\DevKit\lib\perl5\5.8\msys\CORE\我正在运行Windows7并尝试在Aptana3中构建我的Rails项目。我的Ruby是1.9.3。$gemin
arrays - 计算数组中的匹配元素 - 2
给定两个大小相等的数组，如何找到不考虑位置的匹配元素的数量？例如:[0,0,5]和[0,5,5]将返回2的匹配项，因为有一个0和一个5共同；[1,0,0,3]和[0,0,1,4]将返回3的匹配项，因为0有两场，1有一场；[1,2,2,3]和[1,2,3,4]将返回3的匹配项。我尝试了很多想法，但它们都变得相当粗糙和令人费解。我猜想有一些不错的Ruby习惯用法，或者可能是一个正则表达式，可以很好地回答这个解决方案。最佳答案您可以使用count完成它:a.count{|e|index=b.index(e)andb.delete_at
ruby-on-rails - 为什么方法 column_types 在 Rails 5.0 中未定义？ - 2
我正在为一个类赋值，它在rspec测试中使用了column_types方法。it"Userdatabasestructureinplace"doexpect(User.column_names).toinclude"password_digest","username"expect(User.column_types["username"].type).toeq:stringexpect(User.column_types["password_digest"].type).toeq:stringexpect(User.column_types["created_at"].type).t

mysql - SELECT DISTINCT(column) FROM table on an indexed column 的计算复杂度

有关mysql - SELECT DISTINCT(column) FROM table on an indexed column 的计算复杂度的更多相关文章

随机推荐