1. 程式人生 > 資料庫 >Mysql 單表查詢-排序-分頁-group by初識

Mysql 單表查詢-排序-分頁-group by初識

Mysql 單表查詢-排序-分頁-group by初識

對於select 來說, 分組聚合(((group by; aggregation), 排序 (order by** ), 分頁查詢 (limit), 等這些操作, 都是結合 where 過濾(算術表示式, 邏輯表示式, 判空, 範圍過濾, 模糊查詢), 來進一步對資料集為所欲為地操作哦, group by 也是我工作中每天都必用的, 因為我每天要拆分資料嘛, 先按一或多個欄位 group by, 然後, 再對每組的抑或多個欄位進行聚合(sum, avg, max, quartile...)等.

直接來理解SQL分組聚合, 一開始還是不容易的, 一個是對group by 不熟, 另一個對sql語句不熟. 針對這點, 我是每天都在用Excel的透視表

, 各種透視, 多條件透視, 整吐了過後, 就徹底明白了. 雖然我是有些討厭Excel, 但不得不說, 它能讓你直觀地理解很多資料, 資料結構, 程式設計相關的概念.

資料依然是上篇, students表(where 初識那一篇).

準備測試資料

-- win 下, 進入終端 (cmd + R)
mysql -u root -p

C:\Users\chenjie>mysql -u root -p
Enter password: ********

-- 再重新來手打一遍吧, 一點經驗之談, 對我學習方法就是, 多抄程式碼, 抄多了, 手就有感覺了, 跟打字一樣的, 變成了一種下意識, 而非腦袋過一遍就覺得懂了哦,真的是唯手熟爾哦.

-- 建立資料庫
drop database if exists student_db;
create database student_db charset=utf8;

use student_db;

-- 建立學生表-測試
create table students(
    id int unsigned primary key auto_increment not null,
    name varchar(20) default "",
    age tinyint unsigned default 0, -- 建議給預設值, Null查詢慢
    height decimal(5,2),  -- 共5位, 小數佔2位
    gender enum("男", "女", "未填寫"),
    class_id int unsigned default 1,
    is_delete bit default 0
);

-- 班級表
drop table if exists classes;
create table classes(
    id int unsigned auto_increment primary key not null,
    name varchar(20) not null
);

-- 插入偶像, 用於測試哦只是, 別無它意
insert into students values
(0,'愛因斯坦',18,180.00,1,1,0),
(0,'居里夫人',18,180.00,2,2,1),
(0,'小王子',14,185.00,1,1,0),
(0,'李銀河',59,175.00,1,2,1),
(0,'黃蓉',38,160.00,2,1,0),
(0,'冰心',28,150.00,2,2,1),
(0,'王祖賢',18,172.00,2,1,1),
(0,'周杰倫',36,NULL,1,1,0),
(0,'王小波',57,181.00,1,2,0),
(0,'林徽因',25,166.00,2,2,0),
(0,'小星',33,162.00,3,3,1),
(0,'張愛玲',12,180.00,2,4,0),
(0,'馮唐',12,170.00,1,4,0),
(0,'胡適',34,176.00,2,5,0);

insert into classes values
(0, "科學"),
(0, "藝術");

-- 如果失敗, 要麼就是語法不對, 要麼就是 沒有開服服務
Query OK, 14 rows affected (0.03 sec)
Records: 14  Duplicates: 0  Warnings: 0

mysql>
mysql> insert into classes values
    -> (0, "科學"),
    -> (0, "藝術");
Query OK, 2 rows affected (0.04 sec)
Records: 2  Duplicates: 0  Warnings: 0

-- 測試
select * from students;
select * from calsses;

+----+--------------+------+--------+-----------+----------+-----------+
| id | name         | age  | height | gender    | class_id | is_delete |
+----+--------------+------+--------+-----------+----------+-----------+
|  1 | 愛因斯坦     |   18 | 180.00 | 男        |        1 |           |
|  2 | 居里夫人     |   18 | 180.00 | 女        |        2 |          |
|  3 | 小王子       |   14 | 185.00 | 男        |        1 |           |
|  4 | 李銀河       |   59 | 175.00 | 男        |        2 |          |
|  5 | 黃蓉         |   38 | 160.00 | 女        |        1 |           |
|  6 | 冰心         |   28 | 150.00 | 女        |        2 |          |
|  7 | 王祖賢       |   18 | 172.00 | 女        |        1 |          |
|  8 | 周杰倫       |   36 |   NULL | 男        |        1 |           |
|  9 | 王小波       |   57 | 181.00 | 男        |        2 |           |
| 10 | 林徽因       |   25 | 166.00 | 女        |        2 |           |
| 11 | 小星         |   33 | 162.00 | 未填寫    |        3 |          |
| 12 | 張愛玲       |   12 | 180.00 | 女        |        4 |           |
| 13 | 馮唐         |   12 | 170.00 | 男        |        4 |           |
| 14 | 胡適         |   34 | 176.00 | 女        |        5 |           |
+----+--------------+------+--------+-----------+----------+-----------+
14 rows in set (0.00 sec)

mysql> select * from classes;
+----+--------+
| id | name   |
+----+--------+
|  1 | 科學   |
|  2 | 藝術   |
+----+--------+

-- 手抖了, 改下 胡適先生的性別
update students as s
set s.gender := "男"
where s.name = "胡適";

Query OK, 1 row affected (0.10 sec)
Rows matched: 1  Changed: 1  Warnings: 0

-- 檢測一波
select s.name, s.gender
from students s  -- 養成 as 取別名的習慣, 為後面多張表連線預熱哦
where s.name = "胡適";

+--------+--------+
| name   | gender |
+--------+--------+
| 胡適   | 男     |
+--------+--------+
1 row in set (0.00 sec)

排序 order by

  • order by 欄位
  • desc 降序
  • asc 升序, 預設是asc
-- 查詢18到28之間的女生姓名及身高, 並按年齡降序
select s.name, s.height
from students as s
where (age between 18 and 24) and (gender = "女")
order by age desc;

+--------------+--------+
| name         | height |
+--------------+--------+
| 居里夫人     | 180.00 |
| 王祖賢       | 172.00 |
+--------------+--------+
2 rows in set (0.00 sec)

-- 查詢年齡在18到35歲的男性姓名, 年齡,身高, 班級, 要求按身高降序, 身高相同則按年齡升序
select s.name, s.age, s.height, s.class_id
from students as s
where (age between 18 and 35) and (gender = "男")
order by height desc, age asc;

+--------------+------+--------+----------+
| name         | age  | height | class_id |
+--------------+------+--------+----------+
| 愛因斯坦      |   18 | 180.00 |        1 |
| 胡適         |   34 | 176.00 |        5 |
+--------------+------+--------+----------+

-- 查詢18-28的女生, 要求按身高降序, 若身高相同則按年齡升序, 身高相同則按id降序
select * 
from students s  -- as 可以省略的
where age between 18 and 28 and gender = "女"
order by height desc, age asc, id desc;

+----+----------+-----+--------+--------+----------+-----------+
| id | name     | age | height | gender | class_id | is_delete |
+----+----------+-----+--------+--------+----------+-----------+
|  2 | 居里夫人 |  18 | 180.00 | 女     |        2 | 1         |
|  7 | 王祖賢   |  18 | 172.00 | 女     |        1 | 1         |
| 10 | 林徽因   |  25 | 166.00 | 女     |        2 | 0         |
|  6 | 冰心     |  28 | 150.00 | 女     |        2 | 1         |
+----+----------+-----+--------+--------+----------+-----------+
4 rows in set (0.06 sec)

分頁查詢 limit

為啥要分頁查詢呢, 就好比我們平時瀏覽網頁時, 一下也看不完那麼多內容的, 網頁內容也是隨使用者看一點, 載入一點, 這樣, 邊看邊查詢, 就不會給伺服器太大壓力了呀.

-- 語法: limit start=0, count;
-- 需求: 每頁顯示 m 條資料, 當前顯示第 n 頁;
-- 原理: 第 n 頁前有(n-1)頁資料, 即(n-1)*m 條資料, 即第n頁的的小標 start = (n-1)*m;
-- 案例: 假設有10條資料, 要求每頁顯示2條資料, 要顯示第3頁數則, start=(3-1)*2=4, 即 limit 4;

-- 查詢前3個數據
select * from students limit 3

-- 查詢第3個頁面, 每頁顯示2個數據
-- start = (3-1)* = 4
select * from students limit 4, 2;

+----+------+-----+--------+--------+----------+-----------+
| id | name | age | height | gender | class_id | is_delete |
+----+------+-----+--------+--------+----------+-----------+
|  5 | 黃蓉 |  38 | 160.00 | 女     |        1 | 0         |
|  6 | 冰心 |  28 | 150.00 | 女     |        2 | 1         |
+----+------+-----+--------+--------+----------+-----------+

-- 查詢第4頁, 每頁顯示3個學生的姓名, 班級
-- start = (4-1)*3 = 9
select s.name, s.class_id
from students s
limit 9, 3;

+--------+----------+
| name   | class_id |
+--------+----------+
| 林徽因 |        2 |
| 小星   |        3 |
| 張愛玲 |        4 |
+--------+----------+
3 rows in set (0.08 sec)

分組 group by

分組聚合是資料分析的基礎, 就我平時的工作而言, 天天都是在分組聚合, 俗稱"拉一下資料, 透視一下表, 拆分數更細",都是一個道理, 先分組, 再聚合.

以Excel表為例, 說明一下欄位的值. 基本就兩種, 類別值欄位 和 連續值欄位, 比如年齡就是一個連續值欄位, 可以對其求平均值, 最大值等(當然也可以離散化). 而對於性別來講, 就是分類值欄位, 要麼男性, 要麼女性, 要麼...反正數得過來, 一般很少聽到, 對性別求平均, 求最值, 大概率是沒有滴吧.

常見聚合函式

max, min, sqrt, sum, avg, count ...等

-- 最高的身高是多少
select max(height) from students;
+-------------+
| max(height) |
+-------------+
| 185.00      |
+-------------+

-- 身高最高的女生姓名,身高, 年齡 (提前劇透一下子查詢吧)
-- step1: 先查詢最高的女性身高, 得到一個標量值
select max(s.height)
from students as s
where gender="女";

+---------------+
| max(s.height) |
+---------------+
| 180.00        |
+---------------+

-- step2: 將該值作為where條件即可
select s.name, s.age, s.height
from students as s
where height = (
    select max(s.height)
	from students as s
	where gender="女"
);

+----------+-----+--------+
| name     | age | height |
+----------+-----+--------+
| 愛因斯坦 |  18 | 180.00 |
| 居里夫人 |  18 | 180.00 |
| 張愛玲   |  12 | 180.00 |
+----------+-----+--------+

-- 所有學生的平均年齡, 當然可直接用avg函式
-- count(*)表示不忽略空值計算
select sum(age) / count(id)  as "平均年齡"
from students; 

+----------+
| 平均年齡 |
+----------+
| 28.7143  |
+----------+
1 row in set (0.07 sec)

-- 計算女性的平均身高, 並保留2位小數
select round(avg(s.height), 2) as "女生平均身高"
from students as s
where s.gender="女";

+--------------+
| 女生平均身高 |
+--------------+
| 168.00       |
+--------------+
1 row in set (0.06 sec)

分組groupby

分組就一種情景, 按單欄位或多欄位 分組, 不懂的請自行熟練Excel透視表 就明白了.

-- 根據性別分組, 顯示所有的年齡
select s.gender
from students as s
group by gender;

+--------+
| gender |
+--------+
| 男     |
| 女     |
| 未填寫 |
+--------+
3 rows in set (0.06 sec)

-- 計算不同班級的人數各為多少
select s.class_id, count(id)  as "班級人數"
from students as s
group by class_id;

+----------+----------+
| class_id | 班級人數 |
+----------+----------+
|        1 |        5 |
|        2 |        5 |
|        3 |        1 |
|        4 |        2 |
|        5 |        1 |
+----------+----------+
5 rows in set (0.06 sec)

-- 計算每個班學生的平均年齡, 結果保留2位小數
select s.class_id as "班級編號", round(avg(age),2) as "平均年齡"
from students s
group by s.class_id;

+----------+----------+
| 班級編號 | 平均年齡 |
+----------+----------+
|        1 | 24.80    |
|        2 | 37.40    |
|        3 | 33.00    |
|        4 | 12.00    |
|        5 | 34.00    |
+----------+----------+
5 rows in set (0.07 sec)

-- 查詢出每個班級中的每個學生的姓名
-- group_concat() 組內查詢
select s.class_id, group_concat(s.name)
from students as s
group by class_id;

+----------+------------------------------------+
| class_id | group_concat(s.name)               |
+----------+------------------------------------+
|        1 | 愛因斯坦,小王子,黃蓉,王祖賢,周杰倫 |
|        2 | 居里夫人,李銀河,冰心,王小波,林徽因 |
|        3 | 小星                               |
|        4 | 張愛玲,馮唐                        |
|        5 | 胡適                               |
+----------+------------------------------------+
5 rows in set (0.08 sec)

-- 查詢平均年齡大於25歲的學生姓名, 性別
-- 方案1: 以性別分組, 然後 having 組內過濾
-- 方案2: 子查詢
select gender, group_concat(name), avg(age)
from students as s
group by gender
having avg(age) >=25;

+--------+------------------------------------------------+----------+
| gender | group_concat(name)                             | avg(age) |
+--------+------------------------------------------------+----------+
| 男     | 愛因斯坦,小王子,李銀河,周杰倫,王小波,馮唐,胡適 | 32.8571  |
| 未填寫 | 小星                                           | 33.0000  |
+--------+------------------------------------------------+----------+
2 rows in set (0.07 sec)

-- 查詢不同性別中, 人數多於2個的學生性別,身高
select gender, group_concat(name), count(id)
from students
group by gender
having count(id) > 2;

+--------+------------------------------------------------+-----------+
| gender | group_concat(name)                             | count(id) |
+--------+------------------------------------------------+-----------+
| 男     | 愛因斯坦,小王子,李銀河,周杰倫,王小波,馮唐,胡適 |         7 |
| 女     | 居里夫人,黃蓉,冰心,王祖賢,林徽因,張愛玲        |         6 |
+--------+------------------------------------------------+-----------+
2 rows in set (0.08 sec)

-- with rollup 彙總, 不習慣sql彙總, 用其他程式語言來整更靈活方便呀
select gender,group_concat(name) 
from students 
group by gender
with rollup;

小結

  • where 過濾, 結合排序, 分組, 聚合 這一套組合操作, 能滿足更多的業務場景

  • 排序: order by 預設升序asc; 降序desc

  • 分頁: limit; 語法: limit start=0, count; 查詢第n頁顯示m個數據, 則 start = (n-1) * m

  • 分類彙總, 先分類, 再彙總, 特別特重要, group by 結合聚合函式, Excel的資料透視表玩6了就沒問題.

  • 常見聚合函式: min, max, sum, avg, count, round, sqrt .....

  • group by 及理解組內過濾 group_concat 的內在邏輯.

  • 預告: 下一節整一波多表連線 Join查詢結合group by 和 aggregate.