草庐IT

MySQL计算多个列/表的最大值

coder 2023-10-23 原文

我有一些 mysql 表,我想从中提取一些信息,这些表是:

  • Videos - 代表带有分数的视频。
  • 标签 - 包含标签的全局列表。
  • VideoTags - 创建视频和标签之间的关联。

除了视频资源,我还有图片资源:

  • 图片 - 代表带有分数的图片。
  • PictureTopic - 在图片和主题之间建立关联。

还有一个用于记录视频和图片所有权的用户表

  • 用户 - 可以拥有视频和图片

我想做的是为每个标签/主题找到得分最高的视频或图片。有很多具有相同标签/主题的视频和图片,但我的结果集将具有 与标签/主题相同的行数。最终目标是为每个唯一标签(标签是一个以散列为前缀的主题)列出最佳视频或图片(按点)。

使用上一个问题的解决方案 (http://stackoverflow.com/questions/12778329/mysql-data-extraction-from-3-tables-joins-and-max) 我能够获得每个标签最高分的所有视频。

SELECT SUBSTR(Tags.content,2) as topic_id, Videos.id as resource_id, 'video' as resource_type, Videos.owner_id as resource_owner_id, Videos.points FROM Videos JOIN (
  SELECT   VideoTags.tag_id, MAX(points) points
  FROM     Videos JOIN VideoTags ON Videos.id = VideoTags.video_id
  GROUP BY VideoTags.tag_id
) t USING (points) JOIN Tags ON t.tag_id = Tags.id and Tags.content LIKE "#%"

我也可以(有点)用这个表达式得到每个主题最高分的图片:

SELECT   PictureTopic.topic_id, Pictures.id as resource_id, 'picture' as resource_type, Pictures.owner_id as resource_owner_id, MAX(points) points
FROM     Pictures JOIN PictureTopic ON Pictures.id = PictureTopic.picture_id
GROUP BY PictureTopic.topic_id

我想要的是为每个标签/主题获取最高分的图片或视频,并处理以下边缘情况:

  • 如果给定主题有多个图片或视频(即它们具有相同的高分),则遵从资源所有者的分数,如果它们也具有相同的分数(不太可能),则两个资源都可以在结果集中(除非资源归同一用户所有,在这种情况下,结果集中应该只有一个结果)。
  • 如果视频或图片的点数小于 20,则将该资源从结果集中排除。

作为一名经常使用 Grails 的软件开发人员,我喜欢依赖对象关系映射,因此我的 sql 技能很差。到目前为止,我能做的最好的事情就是将两个选择的结果放在一起:

SELECT SUBSTR(Tags.content,2) as topic_id, Videos.id as resource_id, 'video' as resource_type, Videos.owner_id as resource_owner_id, Videos.points FROM Videos JOIN (
  SELECT   VideoTags.tag_id, MAX(points) points
  FROM     Videos JOIN VideoTags ON Videos.id = VideoTags.video_id
  GROUP BY VideoTags.tag_id
) t USING (points) JOIN Tags ON t.tag_id = Tags.id and Tags.content LIKE "#%"
UNION
SELECT   PictureTopic.topic_id, Pictures.id as resource_id, 'picture' as resource_type, Pictures.owner_id as resource_owner_id, MAX(points) points
FROM     Pictures JOIN PictureTopic ON Pictures.id = PictureTopic.picture_id
GROUP BY PictureTopic.topic_id

但不幸的是,这甚至没有获得预期的高分图片。从 sqlfiddle ( http://sqlfiddle.com/#!2/6650d/1 ) 可以看出

这个查询的输出是:

TOPIC_ID    RESOURCE_ID         RESOURCE_TYPE   RESOURCE_OWNER_ID   POINTS
topic-1     owner-x-video-a     video           owner-x             20
topic-2     owner-y-video-m     video           owner-y             44
topic-1     owner-j-pic-1       picture         owner-j             50
topic-3     owner-k-pic-2       picture         owner-k             22

但我也希望这一行:

TOPIC_ID    RESOURCE_ID         RESOURCE_TYPE   RESOURCE_OWNER_ID   POINTS
topic-3     owner-l-pic-3       picture         owner-l             22

在相同高分和分数阈值的边缘情况之后,我希望看到:

TOPIC_ID    RESOURCE_ID         RESOURCE_TYPE   RESOURCE_OWNER_ID   POINTS
topic-1     owner-j-pic-1       picture         owner-j             50
topic-2     owner-y-video-m     video           owner-y             44
topic-3     owner-l-pic-3       picture         owner-l             22

这是供引用的架构和示例数据:

CREATE TABLE `Users` (
  `id`       VARCHAR(24) NOT NULL DEFAULT '',
  `points`   DOUBLE      NOT NULL DEFAULT 0,
  PRIMARY KEY (id)
) Engine=InnoDB;

DROP TABLE IF EXISTS `Videos`;
CREATE TABLE `Videos` (
  `id` varchar(24) NOT NULL default '',
  `owner_id` varchar(24) NOT NULL default '',
  `points` DOUBLE NOT NULL default 0
);

DROP TABLE IF EXISTS `Tags`;
CREATE TABLE `Tags` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `content` varchar(32) NOT NULL default ''
PRIMARY KEY (id)
);

DROP TABLE IF EXISTS `VideoTags`;
CREATE TABLE `VideoTags` (
  `video_id` varchar(24) NOT NULL default '',
  `tag_id` int(11) NOT NULL
);

DROP TABLE IF EXISTS `Pictures`;
CREATE TABLE `Pictures` (
  `id` varchar(24) NOT NULL default '',
  `owner_id` varchar(24) NOT NULL default '',
  `points` DOUBLE NOT NULL default 0
);

DROP TABLE IF EXISTS `PictureTopic`;
CREATE TABLE `PictureTopic` (
  `picture_id` varchar(24) NOT NULL,
  `topic_id` varchar(31) NOT NULL
);

INSERT INTO Users (id, points) VALUES ('owner-x', 0);
INSERT INTO Users (id, points) VALUES ('owner-y', 0);
INSERT INTO Users (id, points) VALUES ('owner-j', 0);
INSERT INTO Users (id, points) VALUES ('owner-k', 5);
INSERT INTO Users (id, points) VALUES ('owner-l', 14);

INSERT INTO Videos (id,owner_id,points) VALUES
  ('owner-x-video-a','owner-x', 20),
  ('owner-x-video-b','owner-x', 15),
  ('owner-y-video-k','owner-y', 12),
  ('owner-y-video-l','owner-y', 17),
  ('owner-y-video-m','owner-y', 44);

INSERT INTO Tags (id, content) VALUES
  (111, '#topic-1'),
  (222, '#topic-2');

INSERT INTO VideoTags (video_id,tag_id) VALUES
  ('owner-x-video-a',111),
  ('owner-x-video-b',111),
  ('owner-y-video-k',111),
  ('owner-y-video-l',222),
  ('owner-y-video-m',222);

INSERT INTO Pictures (id, owner_id, points) VALUES ('owner-j-pic-1','owner-j', 50);
INSERT INTO Pictures (id, owner_id, points) VALUES ('owner-k-pic-2','owner-k', 22);
INSERT INTO Pictures (id, owner_id, points) VALUES ('owner-l-pic-3','owner-l', 22);

INSERT INTO PictureTopic (picture_id, topic_id) VALUES ('owner-j-pic-1','topic-1');
INSERT INTO PictureTopic (picture_id, topic_id) VALUES ('owner-k-pic-2','topic-3');
INSERT INTO PictureTopic (picture_id, topic_id) VALUES ('owner-l-pic-3','topic-3');

关于如何最好地提取此信息的任何指示?干杯:)

最佳答案

SELECT TOPIC_ID, RESOURCE_ID, RESOURCE_TYPE, RESOURCE_OWNER_ID, POINTS
FROM (( SELECT pt.topic_id AS TOPIC_ID,
            p.id AS RESOURCE_ID,
            'picture' AS RESOURCE_TYPE,
            p.owner_id AS RESOURCE_OWNER_ID,
            p.points AS POINTS,
            u.points AS user_points
        FROM Pictures AS p
        INNER JOIN PictureTopic AS pt
        ON p.id = pt.picture_id
        INNER JOIN Users AS u
        ON p.owner_id = u.id)
        UNION ALL
    (   SELECT SUBSTR(t.content, 1), v.id, 'video', v.owner_id, v.points, u.points
        FROM Videos AS v
        INNER JOIN VideoTags AS vt
        ON v.id = vt.video_id
        INNER JOIN Tags AS t
        ON vt.tag_id = t.id
        INNER JOIN Users AS u2
        ON v.owner_id = u2.id)
        ORDER BY POINTS DESC, user_points DESC) AS h
GROUP BY TOPIC_ID
ORDER BY TOPIC_ID ASC

此查询使用了 INNER JOIN , subqueries , UNION , GROUP BY和非官方的 MySQL 假设 GROUP BY 将返回基于 ORDER BY POINTS DESC

的第一行

关于MySQL计算多个列/表的最大值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12793915/

有关MySQL计算多个列/表的最大值的更多相关文章

  1. ruby-on-rails - Rails 3 中的多个路由文件 - 2

    Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

  2. ruby-on-rails - 在 Ruby 中循环遍历多个数组 - 2

    我有多个ActiveRecord子类Item的实例数组,我需要根据最早的事件循环打印。在这种情况下,我需要打印付款和维护日期,如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询,用于查找maintenance和payment项目(非排他性查询),并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代

  3. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

    我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

  4. ruby-on-rails - 使用一系列等级计算字母等级 - 2

    这里是Ruby新手。完成一些练习后碰壁了。练习:计算一系列成绩的字母等级创建一个方法get_grade来接受测试分数数组。数组中的每个分数应介于0和100之间,其中100是最大分数。计算平均分并将字母等级作为字符串返回,即“A”、“B”、“C”、“D”、“E”或“F”。我一直返回错误:avg.rb:1:syntaxerror,unexpectedtLBRACK,expecting')'defget_grade([100,90,80])^avg.rb:1:syntaxerror,unexpected')',expecting$end这是我目前所拥有的。我想坚持使用下面的方法或.join,

  5. ruby - 多个属性的 update_column 方法 - 2

    我有一个具有一些属性的模型:attr1、attr2和attr3。我需要在不执行回调和验证的情况下更新此属性。我找到了update_column方法,但我想同时更新三个属性。我需要这样的东西:update_columns({attr1:val1,attr2:val2,attr3:val3})代替update_column(attr1,val1)update_column(attr2,val2)update_column(attr3,val3) 最佳答案 您可以使用update_columns(attr1:val1,attr2:val2

  6. ruby-on-rails - 在 ruby​​ .gemspec 文件中,如何指定依赖项的多个版本? - 2

    我正在尝试修改当前依赖于定义为activeresource的gem:s.add_dependency"activeresource","~>3.0"为了让gem与Rails4一起工作,我需要扩展依赖关系以与activeresource的版本3或4一起工作。我不想简单地添加以下内容,因为它可能会在以后引起问题:s.add_dependency"activeresource",">=3.0"有没有办法指定可接受版本的列表?~>3.0还是~>4.0? 最佳答案 根据thedocumentation,如果你想要3到4之间的所有版本,你可以这

  7. ruby - 使用多个数组创建计数 - 2

    我正在尝试按0-9和a-z的顺序创建数字和字母列表。我有一组值value_array=['0','1','2','3','4','5','6','7','8','9','a','b','光盘','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','','u','v','w','x','y','z']和一个组合列表的数组,按顺序,这些数字可以产生x个字符,比方说三个list_array=[]和一个当前字母和数字组合的数组(在将它插入列表数组之前我会把它变成一个字符串,]current_combo['0','0','0']

  8. ruby-on-rails - before_filter 运行多个方法 - 2

    是否有可能:before_filter:authenticate_user!||:authenticate_admin! 最佳答案 before_filter:do_authenticationdefdo_authenticationauthenticate_user!||authenticate_admin!end 关于ruby-on-rails-before_filter运行多个方法,我们在StackOverflow上找到一个类似的问题: https://

  9. ruby-on-rails - Rails 3.1 中具有相同形式的多个模型? - 2

    我正在使用Rails3.1并在一个论坛上工作。我有一个名为Topic的模型,每个模型都有许多Post。当用户创建新主题时,他们也应该创建第一个Post。但是,我不确定如何以相同的形式执行此操作。这是我的代码:classTopic:destroyaccepts_nested_attributes_for:postsvalidates_presence_of:titleendclassPost...但这似乎不起作用。有什么想法吗?谢谢! 最佳答案 @Pablo的回答似乎有你需要的一切。但更具体地说...首先改变你View中的这一行对此#

  10. ruby-on-rails - 使用 ruby​​ 将多个实例变量转换为散列的更好方法? - 2

    我收到格式为的回复#我需要将其转换为哈希值(针对活跃商家)。目前我正在遍历变量并执行此操作:response.instance_variables.eachdo|r|my_hash.merge!(r.to_s.delete("@").intern=>response.instance_eval(r.to_s.delete("@")))end这有效,它将生成{:first="charlie",:last=>"kelly"},但它似乎有点hacky和不稳定。有更好的方法吗?编辑:我刚刚意识到我可以使用instance_variable_get作为该等式的第二部分,但这仍然是主要问题。

随机推荐