1. 程式人生 > >入門基礎知識

入門基礎知識

承載 clas 同比 技術分享 med 例如 流程 _for 描述

大數據的流程:數據收集、數據儲存、數據建模、數據分析、數據變現。

技術分享

大量看似不相關的事卻能夠通過觀察分析告訴人們背後的因果,並預測未來趨勢。

數據:承載了信息的東西才是數據

信息:把我們不清楚的事情闡明的描述

古典概型:包含的單位事件是有限的,且單位事件包含的概率相等(例如拋硬幣)

排列組合:從某些數據中驅逐一部分,有先後順序的組合(例如買彩票,不同數字的組合)

理解幾個名詞:加權值、平均值、標準差、眾數、中位數、抽樣

標準差:(偏離平均值的程度,波動程度)

  公式:

  • 技術分享

歐氏距離:用於描述多維點之間的距離

  二維:技術分享

  三維:技術分享

  N維:技術分享

曼哈頓距離:兩個點在標準坐標系上的絕對軸距總和

  技術分享

  又稱為出租車距離,例如在橫平豎直的街道,出租車從一個位置到另外一個位置的距離。曼哈頓距離更多的是應用意義。

同比與環比:

  同比:與相鄰時段的同一時期相比

  環比:直接和報告的上一時期相比

高斯分布:又成為正態分布

     

入門基礎知識