SQL 如何進行並集、交集、差集等集合運算

来源:https://www.cnblogs.com/vin-c/archive/2022/06/15/16377793.html
-Advertisement-
Play Games

本文將會和大家一起學習集合運算操作。集合在數學領域表示“(各種各樣的)事物的總和”,在資料庫領域表示記錄的集合。具體來說,表、視圖和查詢的執行結果都是記錄的集合。 本文重點 集合運算就是對滿足同一規則的記錄進行的加減等四則運算。 使用 UNION(並集)、INTERSECT(交集)、EXCEPT(差 ...


目錄

本文將會和大家一起學習集合運算操作。集合在數學領域表示“(各種各樣的)事物的總和”,在資料庫領域表示記錄的集合。具體來說,表、視圖和查詢的執行結果都是記錄的集合。

本文重點

  • 集合運算就是對滿足同一規則的記錄進行的加減等四則運算。

  • 使用 UNION(並集)、INTERSECT(交集)、EXCEPT(差集)等集合運算符來進行集合運算。

  • 集合運算符可以去除重覆行。

  • 如果希望集合運算符保留重覆行,就需要使用 ALL 選項。

一、什麼是集合運算

截至目前,我們已經學習了 從表中讀取數據 以及 插入數據 的方法。

所謂集合運算,就是對滿足同一規則的記錄進行的加減等四則運算。

通過集合運算,可以得到兩張表中記錄的集合或者公共記錄的集合,又或者其中某張表中的記錄的集合。

像這樣用來進行集合運算的運算符稱為集合運算符

本文將會為大家介紹表的加減法,SQL 如何使用內聯結、外聯結和交叉聯結 將會和大家一起學習進行“表聯結”的集合運算符及其使用方法-->。

二、表的加法——UNION

首先為大家介紹的集合運算符是進行記錄加法運算的 UNION(並集)

在學習具體的使用方法之前,我們首先添加一張表,該表的結構與之前我們使用的 Product(商品)表相同,只是表名變為 Product2(商品 2)(代碼清單 1)。

代碼清單 1 創建表 Product2(商品 2)

CREATE TABLE Product2
(product_id     CHAR(4)      NOT NULL,
 product_name   VARCHAR(100) NOT NULL,
 product_type   VARCHAR(32)  NOT NULL,
 sale_price     INTEGER      ,
 purchase_price INTEGER      ,
 regist_date    DATE         ,
 PRIMARY KEY (product_id));

接下來,我們將代碼清單 2 中的 5 條記錄插入到 Product2 表中。

商品編號(product_id)為“0001”~“0003”的商品與之前 Product 表中的商品相同,而編號為“0009”的“手套”和“0010”的“水壺”是 Product 表中沒有的商品。

代碼清單 2 將數據插入到表 Product2(商品 2)中

SQL Server PostgreSQL

BEGIN TRANSACTION; ---------①
INSERT INTO Product2 VALUES ('0001', 'T恤衫' ,'衣服', 1000, 500, '2009-09-20');
INSERT INTO Product2 VALUES ('0002', '打孔器', '辦公用品', 500, 320, '2009-09-11');
INSERT INTO Product2 VALUES ('0003', '運動T恤', '衣服', 4000, 2800, NULL);
INSERT INTO Product2 VALUES ('0009', '手套', '衣服', 800, 500, NULL);
INSERT INTO Product2 VALUES ('0010', '水壺', '廚房用具', 2000, 1700, '2009-09-20');
COMMIT;

特定的 SQL

不同的 DBMS 的事務處理的語法也不盡相同。代碼清單 2 中的 DML 語句在 MySQL 中執行時,需要將 ① 部分更改為“START TRANSACTION;”。在 Oracle 和 DB2 中執行時,無需用到 ① 的部分(請刪除)。

詳細內容請大家參考 什麼是 SQL 事務 中的“創建事務”。

這樣我們的準備工作就完成了。接下來,就讓我們對上述兩張表進行“Product 表 + Product2 表”的加法計算吧。語法請參考代碼清單 3。

代碼清單 3 使用 UNION 對錶進行加法運算

SELECT product_id, product_name
  FROM Product
UNION
SELECT product_id, product_name
  FROM Product2;

執行結果:

product_id | product_name
-----------+-------------
 0001      | T恤衫
 0002      | 打孔器
 0003      | 運動T恤
 0004      | 菜刀
 0005      | 高壓鍋
 0006      | 叉子
 0007      | 擦菜板
 0008      | 圓珠筆
 0009      | 手套
 0010      | 水壺

上述結果包含了兩張表中的全部商品。可能有些讀者會發現,這就是我們在學校學過的集合中的並集運算,通過文氏圖會看得更清晰(圖 1)。

使用 UNION 對錶進行加法(並集)運算的圖示

圖 1 使用 UNION 對錶進行加法(並集)運算的圖示

商品編號為“0001”~“0003”的 3 條記錄在兩個表中都存在,因此大家可能會認為結果中會出現重覆的記錄,但是 UNION 等集合運算符通常都會除去重覆的記錄。

法則 1

集合運算符會除去重覆的記錄。

三、集合運算的註意事項

其實結果中也可以包含重覆的記錄,在介紹該方法之前,還是讓我們先來學習一下使用集合運算符時的註意事項吧。不僅限於 UNION,之後將要學習的所有運算符都要遵守這些註意事項。

  • 註意事項 ① ——作為運算對象的記錄的列數必須相同

    例如,像下麵這樣,一部分記錄包含 2 列,另一部分記錄包含 3 列時會發生錯誤,無法進行加法運算。

    -- 列數不一致時會發生錯誤
    SELECT product_id, product_name
    FROM Product
    UNION
    SELECT product_id, product_name, sale_price
    FROM Product2;
    
  • 註意事項 ②——作為運算對象的記錄中列的類型必須一致

    從左側開始,相同位置上的列必須是同一數據類型。

    例如下麵的 SQL 語句,雖然列數相同,但是第 2 列的數據類型並不一致(一個是數值類型,一個是日期類型),因此會發生錯誤 [1]

    -- 數據類型不一致時會發生錯誤
    SELECT product_id, sale_price
    FROM Product
    UNION
    SELECT product_id, regist_date
    FROM Product2;
    

    一定要使用不同數據類型的列時,可以使用 SQL 常用的函數 中的類型轉換函數 CAST

  • 註意事項 ③——可以使用任何 SELECT 語句,但 ORDER BY 子句只能在最後使用一次

    通過 UNION 進行並集運算時可以使用任何形式的 SELECT 語句,之前學過的 WHEREGROUP BYHAVING 等子句都可以使用。

    但是 ORDER BY 只能在最後使用一次(代碼清單 4)。

    代碼清單 4 ORDER BY 子句只在最後使用一次

    SELECT product_id, product_name
    FROM Product
    WHERE product_type = '廚房用具'
    UNION
    SELECT product_id, product_name
    FROM Product2
    WHERE product_type = '廚房用具'
    ORDER BY product_id;
    

    執行結果:

    product_id | product_name
    -----------+--------------
    0004      | 菜刀
    0005      | 高壓鍋
    0006      | 叉子
    0007      | 擦菜板
    0010      | 水壺
    

四、包含重覆行的集合運算——ALL 選項

接下來給大家介紹在 UNION 的結果中保留重覆行的語法。其實非常簡單,只需要在 UNION 後面添加 ALL 關鍵字就可以了。

這裡的 ALL 選項,在 UNION 之外的集合運算符中同樣可以使用(代碼清單 5)。

代碼清單 5 保留重覆行

SELECT product_id, product_name
  FROM Product
UNION ALL
SELECT product_id, product_name
  FROM Product2;

執行結果:

執行結果

法則 2

在集合運算符中使用 ALL 選項,可以保留重覆行。

五、選取表中公共部分——INTERSECT

下麵將要介紹的集合運算符在數的四則運算中並不存在,不過也不難理解,那就是選取兩個記錄集合中公共部分的 INTERSECT(交集) [2]

讓我們趕快來看一下吧。其語法和 UNION 完全一樣(代碼清單 6)。

代碼清單 6 使用 INTERSECT 選取出表中公共部分

Oracle SQL Server DB2 PostgreSQL

SELECT product_id, product_name
  FROM Product
INTERSECT
SELECT product_id, product_name
  FROM Product2
ORDER BY product_id;

執行結果:

 product_id | product_name
------------+--------------
 0001       | T恤衫
 0002       | 打孔器
 0003       | 運動T恤

大家可以看到,結果中只包含兩張表中記錄的公共部分。該運算的文氏圖如下所示(圖 2)。

使用 INTERSECT 選取出表中公共部分的圖示

圖 2 使用 INTERSECT 選取出表中公共部分的圖示

與使用 AND 可以選取出一張表中滿足多個條件的公共部分不同,INTERSECT 應用於兩張表,選取出它們當中的公共記錄

其註意事項與 UNION 相同,我們在“集合運算的註意事項”和“保留重覆行的集合運算”中已經介紹過了。希望保留重覆行時同樣需要使用 INTERSECT ALL

六、記錄的減法——EXCEPT

最後要給大家介紹的集合運算符就是進行減法運算的 EXCEPT(差集)[3],其語法也與UNION 相同(代碼清單 7)。

代碼清單 7 使用 EXCEPT 對記錄進行減法運算

SQL Server DB2 PostgreSQL

SELECT product_id, product_name
  FROM Product
EXCEPT
SELECT product_id, product_name
  FROM Product2
ORDER BY product_id;

特定的 SQL

在 Oracle 中執行代碼清單 7 或者代碼清單 8 中的 SQL 時,請將 EXCEPT 改為 MINUS

  -- Oracle中使用MINUS而不是EXCEPT
  SELECT …
    FROM …
  MINUS
  SELECT …
    FROM …;

執行結果:

product_id | product_name
-----------+--------------
 0004      | 菜刀
 0005      | 高壓鍋
 0006      | 叉子
 0007      | 擦菜板
 0008      | 圓珠筆

大家可以看到,結果中只包含 Product 表中記錄除去 Product2 表中記錄之後的剩餘部分。該運算的文氏圖如圖 3 所示。

使用 EXCEPT 對記錄進行減法運算的圖示

圖 3 使用 EXCEPT 對記錄進行減法運算的圖示

EXCEPT 有一點與 UNIONINTERSECT 不同,需要註意一下。

那就是在減法運算中減數和被減數的位置不同,所得到的結果也不相同。4 + 22 + 4 的結果相同,但是 4 - 22 - 4 的結果卻不一樣。

因此,我們將之前 SQL 中的 ProductProduct2 互換,就能得到代碼清單 8 中的結果。

代碼清單 8 被減數和減數位置不同,得到的結果也不同

SQL Server DB2 PostgreSQL

-- 從Product2的記錄中除去Product中的記錄
SELECT product_id, product_name
  FROM Product2
EXCEPT
SELECT product_id, product_name
  FROM Product
ORDER BY product_id;

執行結果:

 product_id | product_name
------------+--------------
 0009       | 手套
 0010       | 水壺

上述運算的文氏圖如圖 4 所示。

使用 EXCEPT 對記錄進行減法運算的圖示(從 Product2 中除去 Product 中的記錄)

圖 4 使用 EXCEPT 對記錄進行減法運算的圖示(從 Product2 中除去 Product 中的記錄)

到此,對 SQL 提供的集合運算符的學習已經結束了。

可能有些讀者會想“唉?怎麼沒有乘法和除法呢?”關於乘法的相關內容,我們將在 SQL 如何使用內聯結、外聯結和交叉聯結 詳細介紹。

此外,SQL 中雖然也存在除法,但由於除法是比較難理解的運算,屬於中級內容,因此我們會在 SQL 如何使用內聯結、外聯結和交叉聯結 末尾的專欄中進行一些簡單的介紹,感興趣的讀者請參考專欄“關係除法”。

原文鏈接:https://www.developerastrid.com/sql/sql-union-intersect-except/

(完)


  1. 實際上,在有些 DBMS 中,即使數據類型不同,也可以通過隱式類型轉換來完成操作。但由於並非所有的 DBMS 都支持這樣的用法,因此還是希望大家能夠使用恰當的數據類型來進行運算。 ↩︎

  2. 因為 MySQL 尚不支持 INTERSECT,所以無法使用。 ↩︎

  3. 只有 Oracle 不使用 EXCEPT,而是使用其特有的 MINUS 運算符。使用 Oracle 的用戶,請用 MINUS 代替 EXCEPT。此外,MySQL 還不支持 EXCEPT,因此也無法使用。 ↩︎


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一 、通過雲開發平臺快速創建初始化應用 1.創建相關應用模版請參考鏈接:去中心化的前端構建工具 — Vite 2.完成創建後就可以在github中查看到新增的Vite倉庫 二 、 本地編寫 Vite後臺項目最佳起始點 1.將應用模版克隆到本地 首先假定你已經安裝了Git、node,沒有安裝請移步no ...
  • 目錄 一、前景回顧 二、A20地址線 三、全局描述符表 四、CR0寄存器的PE位 五、邁入保護模式 六、測試 一、前景回顧 上回我們說到,保護模式下有著三大特點:地址映射、特權級和分時機制。本來接下來是要向這三點一一發起進攻,不過我們首先需要先邁入保護模式中,不然在實模式下講解保護模式顯得不倫不類。 ...
  • 本文介紹什麼是 SQL 視窗函數,視窗函數可以進行排序、生成序列號等一般的 聚合函數 無法實現的高級操作。 本文重點 視窗函數可以進行排序、生成序列號等一般的聚合函數無法實現的高級操作。 理解 PARTITION BY 和 ORDER BY 這兩個關鍵字的含義十分重要。 一、什麼是視窗函數 視窗函數 ...
  • 1 MySQL安裝 安裝環境:Win10 64位 軟體版本:MySQL 5.7.24 解壓版 1.1 下載 https://downloads.mysql.com/archives/community/ 點開上面的鏈接就能看到如下界面: 選擇選擇和自己系統位數相對應的版本點擊右邊的Download, ...
  • 緩存穿透,緩存雪崩,緩存擊穿 本文整理自黑馬程式員相關資料 緩存穿透 緩存穿透是指客戶端請求的數據在緩存中和資料庫中都部存在,這樣緩存永遠不會生效。因此這些請求都會穿過緩存,最終請求到資料庫上,對資料庫造成非常大的壓力。 常見的解決方案有兩種: 緩存空對象:當緩存和資料庫都沒有請求的數據時,將查詢的 ...
  • 本文介紹 SQL 如何使用內聯結(INNER JOIN)、外聯結(OUTER JOIN)和交叉聯結(CROSS JOIN)。簡單來說,就是將其他表中的列添加過來,進行“添加列”的運算。 本文重點 聯結(JOIN)就是將其他表中的列添加過來,進行“添加列”的集合運算。UNION 是以行(縱向)為單位進 ...
  • 導讀: 本文主要介紹嗶哩嗶哩在數據湖與數據倉庫一體架構下,探索查詢加速以及索引增強的一些實踐。主要內容包括: 什麼是湖倉一體架構 嗶哩嗶哩目前的湖倉一體架構 湖倉一體架構下,數據的排序組織優化 湖倉一體架構下,索引增強與優化的實踐探索 -- 01 什麼是湖倉一體 當我們講湖倉一體時,涉及到數據湖和數 ...
  • 原文鏈接:實時開發平臺建設實踐,深入釋放實時數據價值 視頻回顧:點擊這裡 課件獲取:點擊這裡 一、實時數倉建設背景 隨著整體行業的數字化轉型不斷深入以及技術能力的不斷提高,傳統的 T+1 式(隔日)的離線大數據模式越來越無法滿足新興業務的發展需求,開展實時化的大數據業務,是企業深入挖掘數據價值的一條 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...