1. 程式人生 > 其它 ><轉載>SQL 基礎知識梳理(三) - 聚合和排序 SQL 基礎知識梳理(二) - 查詢基礎

<轉載>SQL 基礎知識梳理(三) - 聚合和排序 SQL 基礎知識梳理(二) - 查詢基礎

 

【博主】反骨仔    【原文】http://www.cnblogs.com/liqingwen/p/5926689.html

 

 

  這是《SQL 基礎知識梳理(二) - 查詢基礎》的下篇。

 

目錄

 

一、對錶進行聚合查詢 

  1.聚合函式

    (1)5 個常用函式:

      ①COUNT:計算表中的記錄(行)數。

      ②SUM:計算表中數值列的資料合計值。

      ③AVG:計算表中數值列的資料平均值。

      ④MAX:求出表中任意列中資料的最大值。

      ⑤MIN:求出表中任意列中資料的最小值。

 

    (2)聚合:將多行彙總成一行。

圖1-1 Shohin 表

 

  2.計算表中資料的行數 

--示例
SELECT COUNT(*)  -- *:引數,這裡代表全部列
FROM dbo.Shohin;

 

  3.計算 NULL 以外資料的行數

  將 COUNT(*) 的引數改成指定物件的列,就可以得到該列的非 NULL 行數。

SELECT COUNT(shiire_tanka)
FROM dbo.Shohin;

只計算非 NULL 的行

  【備註】除了 COUNT 函式,其它函式不能將星號作為引數。

  【備註】COUNT 函式的結果根據引數的不同而不同。COUNT(*) 會得到包含 NULL 的資料行數,而 COUNT(<列名>) 會得到 NULL 之外的資料行數。

 

  4.計算合計值

SELECT SUM(hanbai_tanka) AS sum_hanbai_tanka,    --總和
    AVG(hanbai_tanka) AS avg_hanbai_tanka,        --平均
    MAX(hanbai_tanka) AS max_hanbai_tanka,        --最大
    MIN(hanbai_tanka) AS min_hanbai_tanka        --最小
FROM dbo.Shohin;

  【備註】所有的聚合函式,如果以列名為引數,會無視 NULL 值所在的行。

 

SELECT MAX(torokubi),  --torokubi 為日期
    MIN(torokubi)
FROM dbo.Shohin

  【備註】MAX/MIN 函式幾乎適用於所有資料型別的列。SUM/AVG 函式只適用於數值型別的列。

 

  5.使用聚合函式刪除重複值(關鍵字 DISTINCT)

--示例1:計算去除重複資料後的資料行數
SELECT COUNT(DISTINCT shohin_bunrui)
FROM dbo.Shohin;

--示例2:先計算資料行數再刪除重複資料的結果
SELECT DISTINCT COUNT(shohin_bunrui)
FROM dbo.Shohin;

  【備註】在聚合函式的引數中使用 DISTINCT(示例1),可以刪除重複資料。DISTINCT 不僅限於 COUNT 函式,所有的聚合函式都可以使用。

 

二、對錶進行分組

  1.GROUP BY 子句

--語法:
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--GROUP BY <列名1>, <列名2>, ...;
--示例
SELECT shohin_bunrui AS '商品種類',
    COUNT(*) AS '數量'
FROM dbo.Shohin
GROUP BY shohin_bunrui;

  【備註】GROUP BY 子句中指定的列稱為“聚合鍵”或“分組列”。

  【子句的書寫順序(暫定)】SELECT --> FROM --> WHERE --> GROUP BY

 

  2.聚合鍵中包含 NULL 的情況

SELECT shiire_tanka, COUNT(*)
FROM dbo.Shohin
GROUP BY shiire_tanka;

  【備註】聚合鍵中包含 NULL 時,在結果中也會以 NULL 行的形式表現出來。

 

  3.WHERE 對 GROUP BY 執行結果的影響

--語法
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--WHERE <表示式>
--GROUP BY <列名1>, <列名2>, ...
SELECT shiire_tanka, COUNT(*)
FROM dbo.Shohin
WHERE shohin_bunrui = '衣服'
GROUP BY shiire_tanka

  這裡是先根據 WHERE 子句指定的條件進行過濾,然後再進行聚合處理。

  【執行順序】FROM --> WHERE --> GROUP BY --> SELECT。這裡是執行順序,跟之前的書寫順序是不一樣的。

 

  4.與聚合函式和 GROUP BY 子句有關的常見錯誤

  (1)易錯:在 SELECT 子句中書寫了多餘的列

    SELECT 子句只能存在以下三種元素:

      ①常數

      ②聚合函式

      ③GROUP BY 子句中指定的列名(即聚合鍵)

易錯點1

  【總結】使用 GROUP BY 子句時,SELECT 子句不能出現聚合鍵之外的列名。

  (2)易錯:在 GROUP BY 子句中寫了列的別名   

 

易錯點2

  回顧之前說的執行順序,SELECT 子句是在 GROUP BY 子句之後執行。所以執行到 GROUP BY 子句時無法識別別名。

  【總結】GROUP BY 子句不能使用 SELECT 子句中定義的別名。

 

  (3)易錯:GROUP BY 子句的結果能排序嗎?

  【解答】它是隨機的。如果想排序,請使用 ORDER BY 子句。

  【總結】GROUP BY 子句結果的顯示是無序的。

 

  (4)易錯:在 WHERE 子句中使用聚合函式

易錯點3

  【總結】只有 SELECT 子句和 HAVING 子句(以及 ORDER BY 子句)中能夠使用聚合函式。

  

三、為聚合結果指定條件

  1.HAVING 子句

  WHERE 子句智慧指定記錄(行)的條件,而不能用來指定組的條件。

  【備註】HAVING 是 HAVE(擁有)的現在分詞。

--語法:
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--GROUP BY <列名1>, <列名2>, ...
--HAVING <分組結果對應的條件>

  【書寫順序】SELECT --> FROM --> WHERE --> GROUP BY --> HAVING

SELECT shohin_bunrui, COUNT(*)
FROM dbo.Shohin
GROUP BY shohin_bunrui
HAVING COUNT(*) = 2

從通過商品種類進行聚合分組後的結果中,取出“包含資料的行數為 2 行”的資料

  2.HAVING 子句的構成要素

    (1)3 要素:

      ①常數

      ②聚合函式

      ③GROUP BY 子句中指定的列名(即聚合鍵)

易錯用法

  3.HAVING 與 WHERE

  有些條件可以寫在 HAVING 子句中,又可以寫在 WHERE 子句中。這些條件就是聚合鍵所對應的條件。

  

結果一樣

  【建議】雖然結果一樣,聚合鍵對應的條件應該寫在 WHERE 子句中,不是 HAVING 子句中。

  【理由】①WHERE 子句的執行速度比 HAVING 快。

      ②意義:WHERE 子句 = 指定行所對應的條件,HAVING 子句 = 指定組所對應的條件。

 

四、對查詢結果進行排序

  1.ORDER BY 子句

--語法:
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--ORDER BY <排序基準列1>, <排序基準列2>, ...
SELECT shohin_id, hanbai_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka;    --升序排列

銷售單價由低到高(升序)

  排序鍵:ORDER BY 子句中書寫的列名。

  【書寫順序】SELECT --> FROM --> WHERE --> GROUP BY --> HAVING --> ORDER BY

 

   2.升序(ASC)和降序(DESC):

SELECT shohin_id, hanbai_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka DESC;    --降序排列

  【備註】ORDER BY 子句中排列順序時會預設使用升序(ASC)進行排列。

 

  3.指定多個排序鍵

SELECT shohin_id, shohin_mei, hanbai_tanka, shiire_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka, shohin_id;

  4.NULL 值的順序:排序鍵中包含 NULL 時,會在開頭或末尾進行彙總。

 

  5.在排序鍵中使用 SELECT 子句中的別名

SELECT shohin_id AS id, shohin_mei, hanbai_tanka AS ht
FROM dbo.Shohin
ORDER BY ht, id;

 

  【執行順序】FROM --> WHERE --> GROUP BY --> HAVING --> SELECT --> ORDER BY

  【備註】ORDER BY 子句可以使用 SELECT 子句中定義的別名,GROUP BY 子句不能使用別名。

 

  6.ORDER BY 子句中使用聚合函式

SELECT shohin_bunrui, COUNT(*)
FROM dbo.Shohin
GROUP BY shohin_bunrui
ORDER BY COUNT(*);

  7.不建議使用列的編號進行排序,雖然可以

SELECT shohin_id ,
       shohin_mei ,
       shohin_bunrui ,
       hanbai_tanka ,
       shiire_tanka ,
       torokubi
FROM dbo.Shohin
ORDER BY hanbai_tanka DESC, shohin_id;

SELECT shohin_id ,
       shohin_mei ,
       shohin_bunrui ,
       hanbai_tanka ,
       shiire_tanka ,
       torokubi
FROM dbo.Shohin
ORDER BY 4 DESC, 1;  --這裡使用列的編號,由於閱讀不便,不推薦使用

結果是一樣的

  【備註】在 ORDER BY 子句中不要使用列的編號。