1. 程式人生 > 資料庫 >PostgreSQL樹形結構的遞迴查詢示例

PostgreSQL樹形結構的遞迴查詢示例

背景

處理不確定深度的層級結構,比如組織機構,一個常用的設計是在一張表裡面儲存 ID 和 Parent_ID ,並且通過自聯結的辦法構造一顆樹。這種方式對寫資料的過程很友好,但是查詢過程就變得相對複雜。在不引入MPTT模型的前提下,必須通過遞迴演算法來查詢某個節點和下級子節點。

Oracle提供的connect by擴充套件語法,簡單好用。但是其他的RDBMS就沒這麼人性化了(或者我不知道)。最近在專案中使用PostgreSQL來查詢樹形資料,記錄一下。

構造樣本資料

drop table if exists demo.tree_data;
create table demo.tree_data (
 id integer,code text,pid integer,sort integer
);

insert into demo.tree_data values(1,'中國',null,1);
insert into demo.tree_data values(2,'四川',1,1);
insert into demo.tree_data values(3,'雲南',2);
insert into demo.tree_data values(4,'成都',2,1);
insert into demo.tree_data values(5,'綿陽',2);	
insert into demo.tree_data values(6,'武侯區',4,1);
insert into demo.tree_data values(7,'昆明',3,1);	

connectby函式

如果安裝了 tablefunc 擴充套件,就可以使用PG版本的connectby函式。這個沒有Oracle那麼強大,但是可以滿足基本要求。

-- API 如下
connectby(text relname,-- 表名稱
  text keyid_fld,-- id欄位
  text parent_keyid_fld		-- 父id欄位	
  [,text orderby_fld ],-- 排序欄位
  text start_with,-- 起始行的id值
  int max_depth				-- 樹深度,0表示無限
  [,text branch_delim ])	-- 路徑分隔符
-- 基本用法如下,必須通過AS子句定義返回的欄位名稱和型別
select * 
	from connectby('demo.tree_data','id','pid','sort','1','~')
	as (id int,pid int,lvl int,branch text,sort int);
	
-- 查詢結果
id | pid | lvl | branch | sort
----+-----+-----+---------+------
 1 | | 0 | 1 | 1
 2 | 1 | 1 | 1~2 | 2
 4 | 2 | 2 | 1~2~4 | 3
 6 | 4 | 3 | 1~2~4~6 | 4
 5 | 2 | 2 | 1~2~5 | 5
 3 | 1 | 1 | 1~3 | 6
 7 | 3 | 2 | 1~3~7 | 7
(7 rows)
-- 僅僅使用基本用法,只能查詢出id的相關資訊,如果要查詢code等其他欄位,就需要通過額外的join操作來實現。
select 
	t.id,n.code,t.pid,p.code as pcode,lvl,branch
from (
	select * from connectby('demo.tree_data','~')
		as (id int,sort int)
) as t
	left join demo.tree_data as n on (t.id = n.id)
	left join demo.tree_data as p on (t.pid = p.id)
order by t.sort ;	

 id | code | pid | pcode | lvl | branch
----+--------+-----+-------+-----+---------
 1 | 中國 | | | 0 | 1
 2 | 四川 | 1 | 中國 | 1 | 1~2
 4 | 成都 | 2 | 四川 | 2 | 1~2~4
 6 | 武侯區 | 4 | 成都 | 3 | 1~2~4~6
 5 | 綿陽 | 2 | 四川 | 2 | 1~2~5
 3 | 雲南 | 1 | 中國 | 1 | 1~3
 7 | 昆明 | 3 | 雲南 | 2 | 1~3~7
(7 rows)

PS:雖然通過join可以查詢出節點的code,但是branch部分不能直接轉換成對應的code,使用上還是不太方便。

CTE語法

使用CTE語法,通過 with recursive 來實現樹形資料的遞迴查詢。這個方法雖然沒有connectby那麼直接,但是靈活性和顯示效果更好。

-- 
with recursive cte as
(
 -- 先查詢root節點 
 select
 id,code,pid,'' as pcode,code as branch
 from demo.tree_data where id = 1
 union all
 -- 通過cte遞迴查詢root節點的直接子節點 
 select
 origin.id,origin.code,cte.id as pid,cte.code as pcode,cte.branch || '~' || origin.code
 from cte
 join demo.tree_data as origin on origin.pid = cte.id
)
select
 id,pcode,branch,-- 通過計算分隔符的個數,模擬計算出樹形的深度
 (length(branch)-length(replace(branch,'~',''))) as lvl
from cte;

-- 
 id | code | pid | pcode | branch  | lvl
----+--------+-----+-------+-----------------------+-----
 1 | 中國 | | | 中國   | 0
 2 | 四川 | 1 | 中國 | 中國~四川  | 1
 3 | 雲南 | 1 | 中國 | 中國~雲南  | 1
 4 | 成都 | 2 | 四川 | 中國~四川~成都 | 2
 5 | 綿陽 | 2 | 四川 | 中國~四川~綿陽 | 2
 7 | 昆明 | 3 | 雲南 | 中國~雲南~昆明 | 2
 6 | 武侯區 | 4 | 成都 | 中國~四川~成都~武侯區 | 3
(7 rows)

執行過程說明

從上面的例子可以看出,WITH RECURSIVE語句包含了兩個部分

  • non-recursive term(非遞迴部分),即上例中的union all前面部分
  • recursive term(遞迴部分),即上例中union all後面部分

執行步驟如下

  • 執行non-recursive term。(如果使用的是union而非union all,則需對結果去重)其結果作為recursive term中對result的引用,同時將這部分結果放入臨時的working table中
  • 重複執行如下步驟,直到working table為空:用working table的內容替換遞迴的自引用,執行recursive term,(如果使用union而非union all,去除重複資料),並用該結果(如果使用union而非union all,則是去重後的結果)替換working table

以上面的query為例,來看看具體過程

執行non-recursive query

-- step 1 執行
 select
 id,code as branch
 from demo.tree_data where id = 1
 
-- 結果集和working table為
 id | code | pid | pcode | branch
----+------+-----+-------+--------
 1 | 中國 | | | 中國

執行recursive query

-- step 2 執行遞迴,此時自引用cte中的資料是step 1的結果
 select
 origin.id,cte.branch || '~' || origin.code
 from cte
 join demo.tree_data as origin on origin.pid = cte.id
 
 -- 結果集和working table為
 id | code | pid | pcode | branch 
----+--------+-----+-------+---------------------
 2 | 四川 | 1 | 中國 | 中國~四川  
 3 | 雲南 | 1 | 中國 | 中國~雲南  

3、繼續執行recursive query,直到結果集和working table為空

4、結束遞迴,將前三個步驟的結果集合並,即得到最終的WITH RECURSIVE的結果集。

嚴格來講,這個過程實現上是一個迭代的過程而非遞迴,不過RECURSIVE這個關鍵詞是SQL標準委員會定立的,所以PostgreSQL也延用了RECURSIVE這一關鍵詞。

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對我們的支援。