草庐IT

读SQL进阶教程笔记03_自连接

躺柒 2023-03-31 原文

1. 针对相同的表进行的连接

1.1. 相同的表的自连接和不同表间的普通连接并没有什么区别,自连接里的“自”这个词也没有太大的意义

1.2. 与多表之间进行的普通连接相比,自连接的性能开销更大

  • 1.2.1. 特别是与非等值连接结合使用的时候

  • 1.2.2. 用于自连接的列推荐使用主键或者在相关列上建立索引

2. 组合

2.1. 有顺序的有序对(ordered pair)

2.2. 无顺序的无序对(unordered pair)

3. 示例

3.1.

3.2. --用于获取可重排列的SQL语句

    SELECT P1.name AS name_1, P2.name AS name_2
      FROM Products P1, Products P2;
  • 3.2.1. 可重排列,所以结果行数9

3.3. --用于获取排列的SQL语句

    SELECT P1.name AS name_1, P2.name AS name_2
      FROM Products P1, Products P2
     WHERE P1.name <> P2.name;
  • 3.3.1. 排除掉由相同元素构成的对,结果行数为排列6

3.4. --用于获取组合的SQL语句

    SELECT P1.name AS name_1, P2.name AS name_2
      FROM Products P1, Products P2
     WHERE P1.name > P2.name;
  • 3.4.1. 只与“字符顺序比自己靠前”的商品进行配对,结果行数为组合3

3.5. --用于获取组合的SQL语句:扩展成3列

    SELECT P1.name AS name_1, P2.name AS name_2, P3.name AS name_3
      FROM Products P1, Products P2, Products P3
     WHERE P1.name > P2.name
      AND P2.name > P3.name;

3.6. ">”和“<”等比较运算符不仅可以用于比较数值大小,也可以用于比较字符串(比如按字典序进行比较)或者日期

4. 删除重复行

4.1. 示例

  • 4.1.1. --用于删除重复行的SQL语句(1):使用极值函数

       DELETE FROM Products P1
        WHERE rowid < ( SELECT MAX(P2.rowid)
                         FROM Products P2
                         WHERE P1.name = P2. name
                           AND P1.price = P2.price ) ;
    
    • 4.1.1.1. Oracle数据库里的rowid
  • 4.1.2. --用于删除重复行的SQL语句(2):使用非等值连接

       DELETE FROM Products P1
        WHERE EXISTS ( SELECT *
                         FROM Products P2
                       WHERE P1.name = P2.name
                         AND P1.price = P2.price
                         AND P1.rowid < P2.rowid );
    

4.2. 如果从物理表的层面来理解SQL语句,抽象度是非常低的

4.3. “表”“视图”这样的名称只反映了不同的存储方法,而存储方法并不会影响到SQL语句的执行和结果

4.4. 无论表还是视图,本质上都是集合——集合是SQL能处理的唯一的数据结构

5. 查找局部不一致的列

5.1. 示例

  • 5.1.1. --用于查找是同一家人但住址却不同的记录的SQL语句

       SELECT DISTINCT A1.name, A1.address
         FROM Addresses A1, Addresses A2
        WHERE A1.family_id = A2.family_id
         AND A1.address <> A2.address ;
    
  • 5.1.2. --用于查找价格相等但商品名称不同的记录的SQL语句

       SELECT DISTINCT P1.name, P1.price
         FROM Products P1, Products P2
        WHERE P1.price = P2.price
         AND P1.name <> P2.name;
    
  • 5.1.3. 如果改用关联子查询,就不需要DISTINCT了

6. 排序

6.1. 示例

  • 6.1.1. --排序:使用窗口函数

       SELECT name, price,
             RANK() OVER (ORDER BY price DESC) AS rank_1,
             DENSE_RANK() OVER (ORDER BY price DESC) AS rank_2
         FROM Products;
    
    • 6.1.1.1. 在出现相同位次后,rank_1跳过了之后的位次,rank_2没有跳过,而是连续排序

    • 6.1.1.2. 依赖于具体数据库来实现的方法

  • 6.1.2. --排序从1开始。如果已出现相同位次,则跳过之后的位次

       SELECT P1.name,
             P1.price,
             (SELECT COUNT(P2.price)
                 FROM Products P2
               WHERE P2.price > P1.price) + 1 AS rank_1
         FROM Products P1
         ORDER BY rank_1;
    
    • 6.1.2.1. 不依赖于具体数据库来实现的方法

    • 6.1.2.2. 去掉标量子查询后边的+1,就可以从0开始给商品排序

    • 6.1.2.3. 如果修改成COUNT(DISTINCT P2.price),那么存在相同位次的记录时,就可以不跳过之后的位次,而是连续输出(相当于DENSE_RANK函数)

7. 同心圆状的递归集合

7.1. 示例

  • 7.1.1.

  • 7.1.2. --排序:使用自连接

       SELECT P1.name,
             MAX(P1.price) AS price,
             COUNT(P2.name) +1 AS rank_1
         FROM Products P1 LEFT OUTER JOIN Products P2
           ON P1.price < P2.price
        GROUP BY P1.name
        ORDER BY rank_1;
    
    • 7.1.2.1. 外连接就是这样一个用于将第1名也存储在结果里的小技巧
  • 7.1.3. --排序:改为内连接

       SELECT P1.name,
             MAX(P1.price) AS price,
             COUNT(P2.name) +1 AS rank_1
         FROM Products P1 INNER JOIN Products P2
           ON P1.price < P2.price
        GROUP BY P1.name
        ORDER BY rank_1;
    
    • 7.1.3.1. 没有比橘子价格更高的水果,所以它被连接条件P1.price < P2.price排除掉了
  • 7.1.4. --不聚合,查看集合的包含关系

       SELECT P1.name, P2.name
         FROM Products P1 LEFT OUTER JOIN Products P2
           ON P1.price < P2.price;
    

有关读SQL进阶教程笔记03_自连接的更多相关文章

  1. ruby - 续集在添加关联时访问many_to_many连接表 - 2

    我正在使用Sequel构建一个愿望list系统。我有一个wishlists和itemstable和一个items_wishlists连接表(该名称是续集选择的名称)。items_wishlists表还有一个用于facebookid的额外列(因此我可以存储opengraph操作),这是一个NOTNULL列。我还有Wishlist和Item具有续集many_to_many关联的模型已建立。Wishlist类也有:selectmany_to_many关联的选项设置为select:[:items.*,:items_wishlists__facebook_action_id].有没有一种方法可以

  2. ruby - 无法在 60 秒内获得稳定的 Firefox 连接 (127.0.0.1 :7055) - 2

    我使用的是Firefox版本36.0.1和Selenium-Webdrivergem版本2.45.0。我能够创建Firefox实例,但无法使用脚本继续进行进一步的操作无法在60秒内获得稳定的Firefox连接(127.0.0.1:7055)错误。有人能帮帮我吗? 最佳答案 我遇到了同样的问题。降级到firefoxv33后一切正常。您可以找到旧版本here 关于ruby-无法在60秒内获得稳定的Firefox连接(127.0.0.1:7055),我们在StackOverflow上找到一个类

  3. postman接口测试工具-基础使用教程 - 2

    1.postman介绍Postman一款非常流行的API调试工具。其实,开发人员用的更多。因为测试人员做接口测试会有更多选择,例如Jmeter、soapUI等。不过,对于开发过程中去调试接口,Postman确实足够的简单方便,而且功能强大。2.下载安装官网地址:https://www.postman.com/下载完成后双击安装吧,安装过程极其简单,无需任何操作3.使用教程这里以百度为例,工具使用简单,填写URL地址即可发送请求,在下方查看响应结果和响应状态码常用方法都有支持请求方法:getpostputdeleteGet、Post、Put与Delete的作用get:请求方法一般是用于数据查询,

  4. LC滤波器设计学习笔记(一)滤波电路入门 - 2

    目录前言滤波电路科普主要分类实际情况单位的概念常用评价参数函数型滤波器简单分析滤波电路构成低通滤波器RC低通滤波器RL低通滤波器高通滤波器RC高通滤波器RL高通滤波器部分摘自《LC滤波器设计与制作》,侵权删。前言最近需要学习放大电路和滤波电路,但是由于只在之前做音乐频谱分析仪的时候简单了解过一点点运放,所以也是相当从零开始学习了。滤波电路科普主要分类滤波器:主要是从不同频率的成分中提取出特定频率的信号。有源滤波器:由RC元件与运算放大器组成的滤波器。可滤除某一次或多次谐波,最普通易于采用的无源滤波器结构是将电感与电容串联,可对主要次谐波(3、5、7)构成低阻抗旁路。无源滤波器:无源滤波器,又称

  5. 在VMware16虚拟机安装Ubuntu详细教程 - 2

    在VMware16.2.4安装Ubuntu一、安装VMware1.打开VMwareWorkstationPro官网,点击即可进入。2.进入后向下滑动找到Workstation16ProforWindows,点击立即下载。3.下载完成,文件大小615MB,如下图:4.鼠标右击,以管理员身份运行。5.点击下一步6.勾选条款,点击下一步7.先勾选,再点击下一步8.去掉勾选,点击下一步9.点击下一步10.点击安装11.点击许可证12.在百度上搜索VM16许可证,复制填入,然后点击输入即可,亲测有效。13.点击完成14.重启系统,点击是15.双击VMwareWorkstationPro图标,进入虚拟机主

  6. hadoop安装之保姆级教程(二)之YARN的配置 - 2

    1.1.1 YARN的介绍 为克服Hadoop1.0中HDFS和MapReduce存在的各种问题⽽提出的,针对Hadoop1.0中的MapReduce在扩展性和多框架⽀持⽅⾯的不⾜,提出了全新的资源管理框架YARN. ApacheYARN(YetanotherResourceNegotiator的缩写)是Hadoop集群的资源管理系统,负责为计算程序提供服务器计算资源,相当于⼀个分布式的操作系统平台,⽽MapReduce等计算程序则相当于运⾏于操作系统之上的应⽤程序。 YARN被引⼊Hadoop2,最初是为了改善MapReduce的实现,但是因为具有⾜够的通⽤性,同样可以⽀持其他的分布式计算模

  7. Hive SQL 五大经典面试题 - 2

    目录第1题连续问题分析:解法:第2题分组问题分析:解法:第3题间隔连续问题分析:解法:第4题打折日期交叉问题分析:解法:第5题同时在线问题分析:解法:第1题连续问题如下数据为蚂蚁森林中用户领取的减少碳排放量iddtlowcarbon10012021-12-1212310022021-12-124510012021-12-134310012021-12-134510012021-12-132310022021-12-144510012021-12-1423010022021-12-154510012021-12-1523.......找出连续3天及以上减少碳排放量在100以上的用户分析:遇到这类

  8. sql - 查询忽略时间戳日期的时间范围 - 2

    我正在尝试查询我的Rails数据库(Postgres)中的购买表,我想查询时间范围。例如,我想知道在所有日期的下午2点到3点之间进行了多少次购买。此表中有一个created_at列,但我不知道如何在不搜索特定日期的情况下完成此操作。我试过:Purchases.where("created_atBETWEEN?and?",Time.now-1.hour,Time.now)但这最终只会搜索今天与那些时间的日期。 最佳答案 您需要使用PostgreSQL'sdate_part/extractfunction从created_at中提取小时

  9. ruby - 我的 Ruby IRC 机器人没有连接到 IRC 服务器。我究竟做错了什么? - 2

    require"socket"server="irc.rizon.net"port="6667"nick="RubyIRCBot"channel="#0x40"s=TCPSocket.open(server,port)s.print("USERTesting",0)s.print("NICK#{nick}",0)s.print("JOIN#{channel}",0)这个IRC机器人没有连接到IRC服务器,我做错了什么? 最佳答案 失败并显示此消息::irc.shakeababy.net461*USER:Notenoughparame

  10. ruby-on-rails - 连接字符串时如何在 <%=%> block 内输出 html_safe? - 2

    考虑一下:现在这些情况:#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2我需要用其他字符串输出URL。我如何保证&符号不会被转义?由于我无法控制的原因,我无法发送&。求助!把我的头发拉到这里:\编辑:为了澄清,我实际上有一个像这样的数组:@images=[{:id=>"fooid",:url=>"http://

随机推荐