1. 程式人生 > >大數據平臺粗略架構和數倉設計步驟

大數據平臺粗略架構和數倉設計步驟

.com 原則 之前 級別 大數據 步驟 信息 需求 enter

大數據平臺粗略架構

技術分享圖片

數據倉庫設計步驟

1、確定主題

主題與業務密切相關,所以設計數倉之前應當充分了解業務有哪些方面的需求,據此確定主題

2、確定量度

在確定了主題以後,我們將考慮要分析的技術指標,諸如年銷售額之類。量度是要統計的指標,必須事先選
擇恰當,基於不同的量度將直接產生不同的決策結果。

3、確定數據粒度

考慮到量度的聚合程度不同,我們將采用“最小粒度原則”,即將量度的粒度設置到最小。例如如果知道某些數據細分到天就好了,那麽設置其粒度到天;但是如果不確定的話,就將粒度設置為最小,即毫秒級別的。

4、確定維度

設計各個維度的主鍵、層次、層級,盡量減少冗余。

5、創建事實表

事實表中將存在維度代理鍵和各量度,而不應該存在描述性信息,即符合“瘦高原則”,即要求事實表數據條數盡量多(粒度最小),而描述性信息盡量少。

大數據平臺粗略架構和數倉設計步驟