【MySQL】联合查询

程序猿教你打篮球 2023-07-10 原文

1、前言

在实际开发中，往往数据是来自不同的表，所以需要多表联合查询，多表查询是对多张表的数据取笛卡尔积。

这里就需要简单了解下笛卡尔积的概念了：

集合A {a1,a2,a3} 集合B {b1,b2}，他们的笛卡尔积是 A*B = { (a1,b1), (a1,b2), (a2,b1), (a2,b2), (a3,b1), (a3,b2)}任意两个元素结合在一起。

如上图所示，笛卡尔积就是把这两个表放到一起进行计算，分别取出第一张表的每一行，和第二张表的每一行配对，得到一个新的记录。

2、联合查询

有了上述笛卡尔积的认识，我们就来使用下联合查询，首先准备 student，class 这两张表，并且增加相关的数据：

create table student (
    id int primary key,
    name varchar(20),
    classId int
);

create table class (
    classId int primary key,
    name varchar(20)
);

insert into student value
    (23001, '张三', 1),
    (23002, '李四', 2),
    (23003, '王五', 1),
    (23004, '赵六', 3),
    (23005, '孙七', 3);

insert into class value
    (1, 'java1班'),
    (2, 'java2班'),
    (3, 'java3班');

有了上述的数据后，我们就来进行简单的联合查询(通过 student class 表查询出每个学生对应的班级)：

这里我们发现，同时查询两张表，进行了笛卡尔积，跟我们上述画的图是一样的效果，但是这里我们发现有很多无效的元素，按道理来说，张三的 classId 为 1，对应 class 表应该是 java1 班的，所以这里的数据是存在很多无效数据的，此时我们就可以使用 where 条件来进行筛选：

有了筛选条件后，显然发现就没有了那些无效的数据了，此时我们再次省略我们不想要的列，只保留学生姓名和班级名称就好了：

这样一来得到的结果就是我们想要的结果了。

上述可能有一个点之前没有说过，比如 student.classId 和 class.classId，这里为什么要加 表名. 前缀呢？由于我们进行的是多表查询，势必可能会出现不同表中存在相同的列名，这里我们就需要告诉 MySQL 是那个表中的列。如果不加表名，这时就区分不了是哪个表的列了，随之就会报错！

上述是最基础的多表查询，后面我们就来用案例来学习更复杂的多表查询。

3、内连接和外连接

在大多数情况下，都是没有啥区别的，比如要连接的两个表中，里面的数据都是一一对应的，这个时候就没有区别，如果不是一一对应，内连接和外连接就有区别了。

这里我们有这样的两张表，通过看数据可以发现，student表中张三在score表中是没有成绩的，而score表中studentId为4是没有对应学生的。我们就用上述两张表进行联合查询演示下外连接和内连接的区别：

select * from student, score where student.id = score.studentId;
select * from student join score on student.id = score.studentId;
-- 这两种的写法都是一样的效果
+------+--------+-----------+-------+
| id   | name   | studentId | java  |
+------+--------+-----------+-------+
|    1 | 张三   |         1 | 89.00 |
|    2 | 李四   |         2 | 92.00 |
+------+--------+-----------+-------+

上述的写法都属于内连接，此处查询结果中，最终剩下的就是两个表里都有的数据，都能关联上的数据，如果使用外连接，那么结果就不相同了。

● 左外连接：

select * from student left join score on student.id = score.studentId;

● 右外连接：

select * from student right join score on student.id = score.studentId;

我们对比这两种两种连接方式，来观察他们的区别：

左外连接会把左表的结果都列出来，哪怕右表中没有相应的数据，就使用 NULL 来填充
右外连接会把右表的结果都列出来，哪怕左表中没有相应的数据，就使用 NULL 来填充

后续为了演示更复杂的多表查询，以及结合实际的情况，这里我们需要重新构建四张表：

create table classes (
        id int primary key auto_increment, 
        name varchar(20), 
        synopsis varchar(100)
        );

create table student (
        id int primary key, 
        name varchar(20), 
        qq_mail varchar(20) ,
        classes_id int
        );

create table course (
        id int primary key auto_increment, 
        name varchar(20)
        );

create table score (
        score decimal(3, 1), 
        student_id int, 
        course_id int
        );

由于插入数据部分代码太多，不方便放入文章里，大家可以自行录入，也可以去博主的主页去下载现成的 SQL 文件哦。

4、案例演示

4.1 查询篮球哥每科的成绩

此时要注意篮球哥的信息在 student 表中，而成绩在 score 表里，课程名又在 course 表中，而 score 表中包含了 sutdent_id 以及 course_id：

select student.name as '姓名', course.name as '课程名', score.score as '分数' 
from student, score, course 
where student.id = score.student_id and 
      score.course_id = course.id and 
      student.name = '篮球哥';

这里为了大家看的方便，就进行了换行，最终我们只需要显示三个字段，数据来源于 student，score，course 表，接下来就是 where 条件部分了，相信也是清晰明了的。

4.2 查询所有同学的总成绩及邮箱

此时要用到 student，score 这两个表，并且还要使用聚合函数进行求每个同学的总分，也就是要对每个同学的 id 进行分组后，成绩求和。

select student.name, sum(score) as '总分', student.qq_mail
from student, score 
where student.id = score.student_id 
group by student.id;
-- 成绩表对学生表是多对1关系，查询总成绩是根据成绩表的同学id来进行分组的

这里交大家一个简单的方法读 sql 语句，select 后面最终显示的列，from 后面是数据来源的表，where 是进行筛选的条件，group by 是按照某个字段进行分组。这样一来就简洁明了了。

5、自连接

自连接就是自己跟自己笛卡尔积，这不是一个通用的解决方案，而是特殊问题的特殊处理方法，自连接的效果就是把行转换成列，这里我们举个例子：

5.1 显示所有计算机原理成绩比java成绩高的同学

select * from score, score;
-- ERROR 1066 (42000): Not unique table/alias: 'score'

这里发现直接自己跟自己笛卡尔积会报错，说名字重复了，不是唯一的，可以采用取别名的方式来解决这个错误：

select * from score as s1, score as s2;

首先我们要明确这 java 和计算机原理的课程 ID 是多少：

select * from course;
+----+--------------------+
| id | name               |
+----+--------------------+
|  1 | Java               |
|  2 | 中国传统文化       |
|  3 | 计算机原理         |
|  4 | 语文               |
|  5 | 高阶数学           |
|  6 | 英文               |
+----+--------------------+
-- 6 rows in set (0.00 sec)

得到了 java 和计算机原理的 id 之后，对 score 表自身进行笛卡尔积，就可以指定 s1.class_id = 1 and s2.class_id = 3 这样的条件，也就是将一行中 s1 表显示 java， s2 表显示计算机原理：

select * from score as s1, score as s2 where s1.course_id = 1 and s2.course_id = 3;

此查询结果还存在无效的数据，比如 s1.student_id 与 s2.student_id 应该是一样的，因为我们查询的是谁的计算机原理比Java成绩高，所以我们还要加上一个条件：

select * from score as s1, score as s2 
where s1.course_id = 1 
and s2.course_id = 3 
and s1.student_id = s2.student_id;

现在这个结果是满足 id 相等，同时满足了要比较的科目，现在就差一个条件了！就是 s1.score < s2.score 这就表示查询的是 java 成绩小于计算机原理的同学：

select * from score as s1, score as s2 
where s1.course_id = 1 
and s2.course_id = 3 
and s1.student_id = s2.student_id 
and s1.score < s2.score;

最后我们对这个结果保留想要的字段，并且增加 student.name 这个字段，注意增加 student.name 表示要多一个student 表一起进行笛卡尔积，所以我们还要加一个条件 student.id = s1.student_id，这样才是最终完整的结果：

 select student.name, s1.score as Java, s2.score as 计算机原理 
 from student, score as s1, score as s2
 where s1.student_id = s2.student_id 
 and s1.course_id = 1 
 and s2.course_id = 3 
 and s1.score < s2.score 
 and student.id = s1.student_id;

以上就完整的查询出了计算机原理成绩大于Java成绩的同学了！这个过程看似复杂，但不要着急，静下心来一步步分析，阅读 SQL，相信你能理解的！

6、子查询

子查询本质就是套娃，实际开发中，慎重使用，子查询可能会构造出非常复杂，非常不好理解的 SQL，对于代码的可读性就大大降低了，对于 SQL 的执行效率，也有可能是毁灭性的打击！

6.1 查询出篮球哥的同班同学

正常情况下，先查询出篮球哥的班级id，然后条件设置为 claases_id 跟篮球哥的班级id 相同即可，并排掉篮球哥：

select classes_id from student where name = '篮球哥';
-- 1
select * from student where classes_id = 1 and name != '篮球哥';

这样就能求出篮球哥的同班同学，但是子查询是如何写的呢？

select * from student where classes_id = (select classes_id from student where name = '篮球哥') and name != '篮球哥';

子查询的写法其实就是套娃！把一个查询的结果，作为另一个查询的一部分条件(此处作为另一个一部分查询条件的查询结果只能返回一条数据) 。

6.2 多行子查询

● 查询语文或英文课程的成绩信息

正常情况下，我们需要先查询出语文和英文的课程id，然后去成绩表中查询对应课程id 的成绩：

select id from course where name = '语文' or name = '英文';
-- 4 6
select * from score where course_id = 4 or course_id = 6;

如果要用多行子查询就需要利用 in 关键字：

select * from score where course_id in (select id from course where name = '语文' or name = '英文');

如果查询是排除语文英文信息呢？就使用 not in 就行，可以把 in 理解成再这个范围内，整体查询结果必须满足 in 后面子查询的结果范围。

这里的套娃是无穷无尽的，一般不建议这样做，实际上更推荐是直接多步完成查询就好，没必要强行合成一个！

7、合并查询

合并查询就比较简单了，本质上就是把两个查询的结果集合并成一个。

● 查询课程id小于3，或者课程名为英文的课程

select * from course where id < 3 union select * from course where name = '英文';

这里可能有小伙伴就很奇怪，这中间直接来个 or 不就行了吗？是的！

注意：这里的 union 是可以来自于不同的表，只要查询的结果的列匹配即可，而 or 只能是同一表。

除了 union 还有一个 union all，他们区别不大，union 是会进行去重(重复的行只会保留一份)，而 union all 是不会去重的！

MySQL 联合 xff0c xff xff0 数据库 sql

有关【MySQL】联合查询的更多相关文章

ruby - ECONNRESET (Whois::ConnectionError) - 尝试在 Ruby 中查询 Whois 时出错 - 2
我正在用Ruby编写一个简单的程序来检查域列表是否被占用。基本上它循环遍历列表，并使用以下函数进行检查。require'rubygems'require'whois'defcheck_domain(domain)c=Whois::Client.newc.query("google.com").available?end程序不断出错(即使我在google.com中进行硬编码)，并打印以下消息。鉴于该程序非常简单，我已经没有什么想法了-有什么建议吗？/Library/Ruby/Gems/1.8/gems/whois-2.0.2/lib/whois/server/adapters/base.
ruby-on-rails - 在 Rails 和 ActiveRecord 中查询时忽略某些字段 - 2
我知道我可以指定某些字段来使用pluck查询数据库。ids=Item.where('due_at但是我想知道，是否有一种方法可以指定我想避免从数据库查询的某些字段。某种反拔？posts=Post.where(published:true).do_not_lookup(:enormous_field) 最佳答案 Model#attribute_names应该返回列/属性数组。您可以排除其中一些并传递给pluck或select方法。像这样:posts=Post.where(published:true).select(Post.attr
使用canal同步MySQL数据到ES - 2
文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目，Java开发。基于数据库增量日志解析，提供增量数据订阅&消费。Git地址：https://github.co
sql - 查询忽略时间戳日期的时间范围 - 2
我正在尝试查询我的Rails数据库(Postgres)中的购买表，我想查询时间范围。例如，我想知道在所有日期的下午2点到3点之间进行了多少次购买。此表中有一个created_at列，但我不知道如何在不搜索特定日期的情况下完成此操作。我试过:Purchases.where("created_atBETWEEN?and?",Time.now-1.hour,Time.now)但这最终只会搜索今天与那些时间的日期。最佳答案您需要使用PostgreSQL'sdate_part/extractfunction从created_at中提取小时
ruby-on-rails - 无法安装 mysql2 0.3.14 gem - 2
我看到其他人也遇到过类似的问题，但没有一个解决方案对我有用。0.3.14gem与其他gem文件一起存在。我已经完全按照此处指示完成了所有操作:https://github.com/brianmario/mysql2.我仍然得到以下信息。我不知道为什么安装程序指示它找不到include目录，因为我已经检查过它存在。thread.h文件存在，但不在ruby目录中。相反，它在这里:C:\RailsInstaller\DevKit\lib\perl5\5.8\msys\CORE\我正在运行Windows7并尝试在Aptana3中构建我的Rails项目。我的Ruby是1.9.3。$gemin
ruby-on-rails - solr 清理查询 - 2
我在Rails上使用带有ruby的solr。一切正常，我只需要知道是否有任何现有代码来清理用户输入，比如以?开头的查询。或* 最佳答案我不知道执行此操作的任何代码，但理论上可以通过查看parsingcodeinLucene来完成并搜索thrownewParseException(只有16个匹配!)。在实践中，我认为您最好只捕获代码中的任何solr异常并显示“无效查询”消息或类似信息。编辑:这里有几个“sanitizer”:http://pivotallabs.com/users/zach/blog/articles/937-s
ruby-on-rails - Rails 3 在一个查询中包含多个表 - 2
我正在为锦标赛开发一个Rails应用程序。我在这个查询中使用了三个模型:classPlayertruehas_and_belongs_to_many:tournamentsclassTournament:destroyclassPlayerMatch"Player",:foreign_key=>"player_one"belongs_to:player_two,:class_name=>"Player",:foreign_key=>"player_two"在tournaments_controller的显示操作中，我调用以下查询:Tournament.where(:id=>params
ruby-on-rails - Sunspot:如何对具有不同值的多个字段进行全文查询？ - 2
我想用sunspot重现以下原始solr查询q=exact_term_text:fooORterm_textv:foo*ORalternate_text:bar*但我无法通过标准的太阳黑子界面理解这是否可能以及如何实现，因为看起来:fulltext方法似乎不接受多个文本/搜索字段参数我不知道将什么参数作为第一个参数传递给fulltext，就好像我通过了"foo"或"bar"结果不匹配如果我传递一个空参数，我得到一个q=*:*范围过滤器(例如with(:term).starting_with('foo*')(顾名思义)作为过滤器查询应用，因此不参与评分。似乎可以手动编写字符串(或者可能使
ruby - 如何使用 ruby mysql2 执行事务 - 2
我已经开始使用mysql2gem。我试图弄清楚一些基本的事情——其中之一是如何明确地执行事务(对于批处理操作，比如多个INSERT/UPDATE查询)。在旧的ruby-mysql中，这是我的方法:client=Mysql.real_connect(...)inserts=["INSERTINTO...","UPDATE..WHEREid=..",#etc]client.autocommit(false)inserts.eachdo|ins|beginclient.query(ins)rescue#handleerrorsorabortentirelyendendclient.commi
ruby-on-rails - 在不重新查询数据库的情况下重新排序 Rails 中的事件记录？ - 2
例如，假设我有一个名为Products的模型，并且在ProductsController中，我有以下代码用于product_listView以显示已排序的产品。@products=Product.order(params[:order_by])让我们想象一下，在product_listView中，用户可以使用下拉菜单按价格、评级、重量等进行排序。数据库中的产品不会经常更改。我很难理解的是，每次用户选择新的order_by过滤器时，rails是否必须查询，或者rails是否能够以某种方式缓存事件记录以在服务器端重新排序？有没有一种方法可以编写它，以便在用户排序时rails不会重新查询结果