1. 程式人生 > 其它 >【分析雲】-資料倉庫設計

【分析雲】-資料倉庫設計

一、為什麼要寫資料倉庫設計?

  在資料分析體系架構下,不管是大資料庫技術方面的還是傳統資料庫技術層面,資料倉庫都是必不可少,不能避免的環節,而這兩種方式差別是資料儲存、資料處理理念的不同。

二、分析雲需要什麼樣的數倉架構?

  資料倉庫的概念想必都看過很多遍,這裡就不贅述了。咱就以業務開局。

  想象一下,零售場景下,僅僅有一個銷售訂單表,應該怎麼分析呢? 訂單表裡有什麼呢,有訂單時間、門店、支付方式、商品,數量、單價、金額。就是這麼些資料,該怎麼建立數倉呢,廢話不多說,直接上圖吧。

這個圖就是ROLAP下的以事實表為中心的事實表維度表關係圖。

這個圖中,對錶有兩種分類,一類是事實表,表中儲存了時間、門店ID、支付方式ID、商品ID,一類是維度表,儲存了維度的屬性和擴充套件,如時間維度表:日、周、月、季度、年 等資訊。

通過連線,實現了維度表和事實表的關係,這個關係的定義,也就定義了事實表和維度表關聯的方式,表示式裡也就是這個連線的內容,順便說一點,這個表示式是可以編輯的哦。

看懂了這個圖,恭喜你,你已經學會分析雲的核心邏輯,其他的就是產品功能的學習,對你來說不在是什麼大問題。

附:名詞解釋

維度:即是描述參與交易事實的細節成員,比如常用到的客戶、產品等。維度物件在資料。分析過程中反應出分析資料的粒度和角度,若沒有維度物件那麼任何資料都會變得空洞、無意義,所以維度物件是不可少的。

度量:即是描述交易事實的數量、金額、個數等資料資訊,比如經常用到的訂單數量、訂貨金額等。度量物件是資料分析中核心分析物件。所有度量物件都具有一定的聚合性。

維度表:包含維度的相關資訊的表,該表中一般不會定義度量。

事實表:包含維度的ID和度量等資訊,是資料承載的實體。