Oracle並行操作——並行查詢(Parallel Query)
“Parallel Query option is essentially nonscalable”——《Practical Oracle8i:Building Efficient Database》
Oracle的並行操作特性,本質上就是強行榨取除資料庫伺服器空閒資源(主要是CPU資源),對一些高負荷大資料量資料進行分治處理。並行操作是一種非確定性的優化策略,在選擇的時候要小心對待。目前,使用並行操作特性的主要有下面幾個方面:
ü Parallel Query:並行查詢,使用多個作業系統級別的Server Process來同時完成一個SQL查詢;
ü Parallel DML:並行DML操作。類似於Parallel Query。當要對大資料量表進行DML操作,如insert、update和delete的時候,可以考慮使用;
ü Parallel DDL:並行DDL操作。如進行大容量資料表構建、索引rebuild等操作;
ü Parallel Recovery,並行恢復。當資料庫例項崩潰重新啟動,或者進行儲存介質恢復的時候,可以啟動並行恢復技術。從而達到減少恢復時間的目的;
ü Procedural Parallel,過程程式碼並行化。對我們編寫的程式碼片段、儲存過程或者函式,可以實現執行的並行化,從而加快執行效率;
1、並行查詢Parallel Query
並行查詢是比較基礎的技術,也是OLAP和Oracle Data Warehouse經常使用的一種並行技術。同本系列前面一直強調的要素相同,在確定使用並行技術之前,要確定軟硬體的一些先決條件:
ü 任務task必要條件。備選進行並行操作的任務task必須是一個大任務作業,比如,長時間的查詢。任務時間通常可以以分鐘、小時進行計數。只有這樣的任務和需要,才值得讓我們冒險使用並行操作方案;
ü 資源閒置條件。只有在資料庫伺服器資源存在閒置的時候,才可以考慮進行並行處理。如果經常性的繁忙,貿然使用並行只能加劇資源的爭用。
並行操作最大的風險在於並行爭用引起的效率不升反降。所以,要在確定兩個前提之後,再進行並行規劃處理。
2、環境準備
首先,準備實驗環境。由於筆者使用的一般家用PC虛擬機器,所以並行度和儲存量不能反映真實條件需求,見諒。
SQL> select * from v$version where rownum<2;
BANNER
--------------------------------------------------------------------------------
Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - Production
SQL> select count(*) from t;
COUNT(*)
----------
1160704
選擇11gR2伺服器環境,資料表T總資料量超過一百萬。
首先,我們觀察一下不使用並行的執行情況。
//提取出使用遊標資訊;
SQL> select sql_text, sql_id, version_count from v$sqlarea where sql_text like 'select count(*) from t%';
SQL_TEXT SQL_ID VERSION_COUNT
------------------------------ ------------- -------------
select count(*) from t 2jkn7rpsbj64t 2
SQL> select * from table(dbms_xplan.display_cursor('2jkn7rpsbj64t',format => 'advanced', cursor_child_no => 0));
PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
SQL_ID 2jkn7rpsbj64t, child number 0
-------------------------------------
select count(*) from t
Plan hash value: 2966233522
-------------------------------------------------------------------
| Id | Operation | Name | Rows | Cost (%CPU)| Time |
-------------------------------------------------------------------
| 0 | SELECT STATEMENT | | | 4464 (100)| |
| 1 | SORT AGGREGATE | | 1 | | |
| 2 | TABLE ACCESS FULL| T | 1160K| 4464 (1)| 00:00:54 |
-------------------------------------------------------------------
該執行計劃中沒有使用並行特性,進行全表掃描。執行時間為54s。
3、並行查詢計劃
首先,我們設定相應的並行度。設定並行度有兩種方式,一種是使用hint加在特定的SQL語句上。另一種是對大物件設定並行度屬性。
前者的優點是帶有一定的強制性和針對性。就是指定特定的SQL語句進行並行處理。這樣的優點是易於控制並行度,缺點是帶有很強的強制力,當資料量偏小的時候,使用並行優勢不大。而且如果是顯示指定並行度,又會帶來移植伸縮性差的缺點。
後者通過物件的屬性指定並行度。就將並行作為一種執行手段,提供給優化器進行選擇。這樣,CBO會根據系統中資源的情況和資料的實際,進行執行計劃生成。計劃中可能是並行,也可能不是並行。這樣的優點是將並行與否交予優化器CBO去判斷,缺點是並行的濫用風險。
此處,筆者設定自動確定並行度的方式。
SQL> alter table t parallel;
Table altered
SQL> select count(*) from t;
COUNT(*)
----------
1160704
當啟動查詢時,Oracle中的並行伺候程序池會根據系統中的負荷和實際因素,確定分配出的並行程序數量。此時,我們可以通過檢視v$px_process來檢視程序池中的連線資訊。
SQL> select * from v$px_process;
SERVER_NAME STATUS PID SPID SID SERIAL#
----------- --------- ---------- ------------------------ ---------- ----------
P000 AVAILABLE 25 5776
P001 AVAILABLE 26 5778
注意,並行伺候程序是一種特殊的Server Process,本質上是一種可共享的slave程序。專用連線模式下,一般的Server Process與Client Process是“同生共死”的關係,終身服務於一個Client Process。而伺候slave程序是通過程序池進行管理的,一旦啟動初始化,就會在一定時間內駐留在系統中,等待下次並行處理到來。
此時,我們檢查v$process檢視,也可以找到對應的資訊。
SQL> select * from v$process;
PID SPID PNAME USERNAME SERIAL# PROGRAM
-------- ---------- ------------------------ ----- --------------- ---------- -------------------------------
25 5776 P000 oracle 13 [email protected] (P000)
26 5778 P001 oracle 6 [email protected] (P001)
(篇幅原因,有省略……)
32 rows selected
對應的OS中,也存在相應的真實程序伺候。
[[email protected] ~]$ ps -ef | grep oracle
(篇幅原因,有省略……)
oracle 5700 1 0 17:29 ? 00:00:02 oraclewilson (LOCAL=NO)
oracle 5723 1 0 17:33 ? 00:00:00 ora_smco_wilson
oracle 5764 1 2 17:40 ? 00:00:05 oraclewilson (LOCAL=NO)
oracle 5774 1 0 17:42 ? 00:00:00 oraclewilson (LOCAL=NO)
oracle 5776 1 0 17:43 ? 00:00:00 ora_p000_wilson
oracle 5778 1 0 17:43 ? 00:00:00 ora_p001_wilson
oracle 5820 1 1 17:44 ? 00:00:00 ora_w000_wilson
由於此時查詢已經結束,對應的並行會話資訊,已經消失不可見。
SQL> select * from v$px_session;
SADDR SID SERIAL# QCSID QCSERIAL#
-------- ---------- ---------- ---------- ----------
但是,如果任務的時間長,是可以捕獲到對應資訊的。
從上面的情況看,我們執行一個並行操作時,Oracle會從伺候程序池中獲取到對應的並行程序,來進行操作。當操作完成後,伺候程序還會等待一定時間,之後回收。
並行操作程序的資源消耗,通過v$px_sysstat檢視檢視。
SQL> col statistic for a30;
SQL> select * from v$px_process_sysstat;
STATISTIC VALUE
------------------------------ ----------
Servers In Use 0
Servers Available 0
Servers Started 2
Servers Shutdown 2
Servers Highwater 2
Servers Cleaned Up 0
Server Sessions 6
Memory Chunks Allocated 4
Memory Chunks Freed 0
Memory Chunks Current 4
Memory Chunks HWM 4
Buffers Allocated 30
Buffers Freed 30
Buffers Current 0
Buffers HWM 8
15 rows selected
下面,我們檢查一下執行計劃資訊。
SQL> set pagesize 10000;
SQL> select * from table(dbms_xplan.display_cursor('2jkn7rpsbj64t',format => 'advanced',cursor_child
_no => 1));
PLAN_TABLE_OUTPUT
----------------------------------------------------------------------------------------------------
SQL_ID 2jkn7rpsbj64t, child number 1
-------------------------------------
select count(*) from t
Plan hash value: 3126468333
----------------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Cost (%CPU)| Time | TQ |IN-OUT| PQ Distrib
----------------------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | | 2478 (100)| | | |
| 1 | SORT AGGREGATE | | 1 | | | | |
| 2 | PX COORDINATOR | | | | | | |
| 3 | PX SEND QC (RANDOM) | :TQ10000 | 1 | | | Q1,00 | P->S | QC (RAND)
| 4 | SORT AGGREGATE | | 1 | | | Q1,00 | PCWP |
| 5 | PX BLOCK ITERATOR | | 1160K| 2478 (1)| 00:00:30 | Q1,00 | PCWC |
|* 6 | TABLE ACCESS FULL| T | 1160K| 2478 (1)| 00:00:30 | Q1,00 | PCWP |
----------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
6 - access(:Z>=:Z AND :Z<=:Z)
從執行計劃的條件(6 - access(:Z>=:Z AND :Z<=:Z))中,我們可以看到任務分配,之後分別進行全表掃描。最後排序計算count,合併結果的過程。
4、結論
Oracle Parallel Query是經常使用到的一種並行操作技術。相對於DDL、DML等型別操作,並行查詢更可以作為系統功能的一個步驟來進行。
進行並行查詢最大的風險就是並行濫用和失控的出現。這也是Oracle一直致力解決的問題。在Oracle11gR2中,引入了Parallel Statement Queuing(PSQ)技術特性。通常,只要並行伺候池允許,Oracle會引入儘可能多的並行程序進行操作。PSQ技術的出現,就是從資源角度加入了並行控制。
當系統繁忙的時候,PSQ會將一些要進行的並行操作進入等待狀態,防止並行環境的惡化。當環境好轉之後,等待佇列中的並行語句就進入執行狀態。這個特性就可以有效的防止並行濫用的出現。
相關推薦
Oracle並行操作——並行查詢(Parallel Query)
“Parallel Query option is essentially nonscalable”——《Practical Oracle8i:Building Efficient Database》 Oracle的並行操作特性,本質上就是強行榨取除資料庫伺服器空閒資源(
Oracle聯合多個子查詢(inner join)
select aaa.*,bbb.xh from (select xn,xq,kcdm,kcmc,xf,xkkh,kcxz from jxrwbview where xn='2017-2018' group by xn,xq,kcdm,kcmc,xf,xkkh,kcxz ) aaa inner joi
並行程式設計(Parallel Framework)
前言 並行程式設計:通過編碼方式利用多核或多處理器稱為並行程式設計,多執行緒概念的一個子集。 並行處理:把正在執行的大量的任務分割成小塊,分配給多個同時執行的執行緒。多執行緒的一種。 並行程式設計分為如下幾個結構: 1.並行的LINQ或PLINQ 2.Parallel類 3.任務並行結構 4.併
27.7 並行語言整合查詢(PLinq)
static void Main() { ObsoleteMethods(Assembly.Load("mscorlib.dll")); Console.ReadKey(); }
Oracle層級查詢語句(hierarchical query)connect by 用法詳解
摘要: 1、connect by中的條件就表示了父子之間的連線關係,比如 connect by id=prior pid。 2、prior,表示在一表上,prior所在列pid的某一值A的記錄行的父親是列id上值等於列pid上值A的記錄行。 3、LEVEL偽列
並行操作(並行Query和DML)以及監控
INSTANCE ---------- ---------- ---------------------------------------- ---------- ---------- ---------- ----------- ---------- ---------- -
oracle中的區間查詢(類似mysql中的limit)
那麼Oracle中有limit嗎,答案是沒有。oracle中可以通過rownumber Oracle使用rownum的關鍵字來實現這種查詢: 首先我們假設有一個地域資訊表area,其表結構如下圖所示: 表中的資料如下圖所示(select * from a
oracle逐步學習總結之oracle分頁查詢(基礎三)
原創作品,轉載請在文章開頭明顯位置註明出處:https://www.cnblogs.com/sunshine5683/p/10087205.html oracle 的分頁有三種,下面將這三種方式一一列舉,進行分析: 一、根據rowid來分頁 二、根據分
C++拾趣——STL容器的插入、刪除、遍歷和查詢操作效能對比(ubuntu g++)——遍歷和查詢
遍歷 從前往後 元素個數>15000 traversal_begin_16384_highest 表現最差的是unordered_multiset。其在遍歷到1000個左右的元素時發生較高的延時操作,然後又穩定下來。 除了
二叉查詢樹的查詢、插入、刪除、釋放等基本操作的實現(C語言)
二叉查詢樹是一種特殊性質的二叉樹,該樹中的任何一個節點,它的左子樹(若存在)的元素值小於節點的元素值,右子樹(若存在)的元素值大於節點的元素值。 實現了二叉樹查詢樹的實現以及基本操作,包括查詢、插入、刪除、初始化、釋放等。 原始碼下載地址:http://download.c
Oracle高效分頁查詢(轉)
-分頁引數:size = 20 page = 2 --沒有order by的查詢 -- 巢狀子查詢,兩次篩選(推薦使用) --SELECT * -- FROM (SELECT ROWNUM AS rowno, t.* -- FROM DONORINFO t -- WHERE t.BIRTHDAY BET
Oracle資料庫的高階查詢(多表查詢)
外連線就是把對於連線條件不成立的記錄,也包含在最後的結果當中,如果我們用的只是等值連線的話,而要查詢的是各部門的人數,如果有一個部門沒有人,在等值連線那邊,就不會顯示出來,但我們要的是顯示所有部門的人數,就算部門沒人也要顯示。這就要用到外連線了。可以以哪一個為主表,主表中的所有欄位值都會顯示出來,而子表中欄位
史上最簡單的 MySQL 教程(二十三)「資料的高階操作 之 查詢(上)」
溫馨提示:本系列博文已經同步到 GitHub,地址為「mysql-tutorial」,歡迎感興趣的童鞋Star、Fork,糾錯。 資料的高階操作 查詢資料(上) 基本語法: select + 欄位列表/* + from + 表名 + [whe
Maven+Mybatis+Spring+SpringMVC實現(oracle)分頁查詢(附原始碼)
關於專案搭建,小寶鴿以前寫過一篇Spirng+SpringMVC+Maven+Mybatis+MySQL專案搭建,這篇文章提供了詳細的搭建過程,而且提供了原始碼下載,接下來的將在這個原始碼的基礎上繼續開發。所以建議各位猿友可以把猿友下載一下。 二、分頁外掛的介紹 博主採用的外掛是PageHelpe
SqlServer和Oracle從多行記錄(資料集)中查詢結果並拼接成一個字串的SQL語句(縱表資料轉成拼接的文字)
使用情景: 例如:需要從學生成績表中,查詢分數大於95分的所有學生編號,用逗號分隔成一個字串。 準備測試資料: create table score (id int,score int) insert into score values(1,90) insert into
db2和oracle中的樹查詢(遞迴查詢)語句
在db2和oracle中的對樹的遞迴查詢語句。 表結構: create table MAIN_NODE ( MLA_ID INTEGER not null , //節點ID MLA_ROOTID IN
Oracle筆記多表查詢(1)
本次預計講解的知識點 1、 多表查詢的操作、限制、笛卡爾積的問題; 2、 統計函式及分組統計的操作; 3、 子查詢的操作,並且結合限定查詢、資料排序、多表查詢、統計查詢一起完成各個複雜查詢的操作; 一、多表查詢的基本概念 在之前所使用的查詢操作之中,都是從一張表之中查詢出所
Oracle資料庫------------------------------分組統計查詢(分組查詢)
Oracle資料庫的學習記錄:十九、分組統計查詢----分組查詢能夠分組的時候往往是指的是部分資料具備某些共性要想分組,使用GROUP BY子句SELECT [DISTINCT] 分組欄位 [別名],分組欄位 [別名],...|統計函式,...FROM 表名稱 [別名] [W
多表查詢(章節摘要)
右外連接 多表查詢 div ora 產生 多個 oracl 數據 數據庫 1,多表查詢指的是一個查詢操作同一時候從多張表取數據的操作。 2,在多表查詢時,因為數據庫的檢索機制會產生笛卡兒積。笛卡兒積是多張數據表的乘積。 3。數據表的連接方式有兩種,即內連接,外連
SQL多表聯合查詢(LEFT JOIN)條件差異
logs 技術分享 .cn where 聯合查詢 uid exist 包含 into 查詢A: select a.*,b.* into Bus605115_ON_Where_And --(642 行受影響) from PositionN a left join szt