oracle分析函式over partition by 和group by的區別
阿新 • • 發佈:2019-02-19
今天看到一個老兄的問題,
大概如下:
查詢出部門的最低工資的userid 號
表結構:
D號 工資 部門
userid salary dept
1 2000 1
2 1000 1
3 500 2
4 1000 2
有一個高人給出了一種答案:
SELECT MIN (salary) OVER (PARTITION BY dept ) salary, dept
FROM ss
執行後得到:
1000 1
1000 1
500 2
500 2
樓主那位老兄一看覺得很高深。大嘆真是高人阿~
我也覺得這位老兄實在是高啊。
但我仔細研究一下發現那位老兄對PARTITION BY的用法理解並不深刻。並沒有解決樓主的問題。
大家請看我修改後的語句
SELECT userid,salary,dept,MIN (salary) OVER (PARTITION BY dept ) salary
FROM ss
執行後的結果:
userid salary dept MIN (salary) OVER (PARTITION BY dept )
1 2000 1 1000
2 1000 1 1000
3 500 2 500
4 1000 2 500
大家看出端倪了吧。
高深的未必適合。
一下是我給出的答案:
SELECT * FROM SS
INNER JOIN (SELECT MIN(SALARY) AS SALARY, DEPT FROM SS GROUP BY DEPT) SS2
USING(SALARY,DEPT)
執行後的結果:
salary dept userid
1000 1 2
500 2 3
由此我想到總結一下group by和partition by的用法
group by是對檢索結果的保留行進行單純分組,一般總愛和聚合函式一塊用例如AVG(),COUNT(),max(),main()等一塊用。
partition by雖然也具有分組功能,但同時也具有其他的功能。
它屬於oracle的分析用函式。
借用一個勤快人的資料說明一下:
sum() over (PARTITION BY ...) 是一個分析函式。 他執行的效果跟普通的sum ...group by ...不一樣,它計算組中表達式的累積和,而不是簡單的和。
表a,內容如下:
B C D
02 02 1
02 03 2
02 04 3
02 05 4
02 01 5
02 06 6
02 07 7
02 03 5
02 02 12
02 01 2
02 01 23
select b,c,sum(d) e from a group by b,c
得到:
B C E
02 01 30
02 02 13
02 03 7
02 04 3
02 05 4
02 06 6
02 07 7
而使用分析函式得到的結果是:
SELECT b, c, d, SUM(d) OVER(PARTITION BY b,c ORDER BY d) e FROM a
B C E
02 01 2
02 01 7
02 01 30
02 02 1
02 02 13
02 03 2
02 03 7
02 04 3
02 05 4
02 06 6
02 07 7
結果不一樣,這樣看還不是很清楚,我們把d的內容也顯示出來就更清楚了:
SELECT b, c, d,SUM(d) OVER(PARTITION BY b,c ORDER BY d) e FROM a
B C D E
02 01 2 2 d=2,sum(d)=2
02 01 5 7 d=5,sum(d)=7
02 01 23 30 d=23,sum(d)=30
02 02 1 1 c值不同,重新累計
02 02 12 13
02 03 2 2
02 03 5 7
02 04 3 3
02 05 4 4
02 06 6 6
02 07 7 7
------------------------------------最佳答案---------------------------
select a.* from
(
select row_number() over(partition by dept order by a.salary asc) nRow,userid ,salary ,dept from TableA
) a
where nRow=1
大概如下:
查詢出部門的最低工資的userid 號
表結構:
D號 工資 部門
userid salary dept
1 2000 1
2 1000 1
3 500 2
4 1000 2
有一個高人給出了一種答案:
SELECT MIN (salary) OVER (PARTITION BY dept ) salary, dept
FROM ss
執行後得到:
1000 1
1000 1
500 2
500 2
樓主那位老兄一看覺得很高深。大嘆真是高人阿~
我也覺得這位老兄實在是高啊。
但我仔細研究一下發現那位老兄對PARTITION BY的用法理解並不深刻。並沒有解決樓主的問題。
大家請看我修改後的語句
SELECT userid,salary,dept,MIN (salary) OVER (PARTITION BY dept ) salary
FROM ss
執行後的結果:
userid salary dept MIN (salary) OVER (PARTITION BY dept )
1 2000 1 1000
2 1000 1 1000
3 500 2 500
4 1000 2 500
大家看出端倪了吧。
高深的未必適合。
一下是我給出的答案:
SELECT * FROM SS
INNER JOIN (SELECT MIN(SALARY) AS SALARY, DEPT FROM SS GROUP BY DEPT) SS2
USING(SALARY,DEPT)
執行後的結果:
salary dept userid
1000 1 2
500 2 3
由此我想到總結一下group by和partition by的用法
group by是對檢索結果的保留行進行單純分組,一般總愛和聚合函式一塊用例如AVG(),COUNT(),max(),main()等一塊用。
partition by雖然也具有分組功能,但同時也具有其他的功能。
它屬於oracle的分析用函式。
借用一個勤快人的資料說明一下:
sum() over (PARTITION BY ...) 是一個分析函式。 他執行的效果跟普通的sum ...group by ...不一樣,它計算組中表達式的累積和,而不是簡單的和。
表a,內容如下:
B C D
02 02 1
02 03 2
02 04 3
02 05 4
02 01 5
02 06 6
02 07 7
02 03 5
02 02 12
02 01 2
02 01 23
select b,c,sum(d) e from a group by b,c
得到:
B C E
02 01 30
02 02 13
02 03 7
02 04 3
02 05 4
02 06 6
02 07 7
而使用分析函式得到的結果是:
SELECT b, c, d, SUM(d) OVER(PARTITION BY b,c ORDER BY d) e FROM a
B C E
02 01 2
02 01 7
02 01 30
02 02 1
02 02 13
02 03 2
02 03 7
02 04 3
02 05 4
02 06 6
02 07 7
結果不一樣,這樣看還不是很清楚,我們把d的內容也顯示出來就更清楚了:
SELECT b, c, d,SUM(d) OVER(PARTITION BY b,c ORDER BY d) e FROM a
B C D E
02 01 2 2 d=2,sum(d)=2
02 01 5 7 d=5,sum(d)=7
02 01 23 30 d=23,sum(d)=30
02 02 1 1 c值不同,重新累計
02 02 12 13
02 03 2 2
02 03 5 7
02 04 3 3
02 05 4 4
02 06 6 6
02 07 7 7
------------------------------------最佳答案---------------------------
select a.* from
(
select row_number() over(partition by dept order by a.salary asc) nRow,userid ,salary ,dept from TableA
) a
where nRow=1