1. 程式人生 > >精益資料分析讀書筆記——第四章-以資料為嚮導與通過資料獲取資訊

精益資料分析讀書筆記——第四章-以資料為嚮導與通過資料獲取資訊

這章沒太看懂……以後回頭再看

濫用資料容易導致區域性優化,進而忽視大局,這是極其危險乃至致命的。 人類提供靈感,機器負責驗證 數學在優化已知系統方向可以做的很好,而人類更善於發現新的系統。換言之,漸進式的改變可以達到區域性極限,創新則可能導致全域性洗牌。 #資料科學家的思維方式(模式) 10條創業者需要避免的資料圈套 (1)假設資料沒有噪聲。分析前先好好檢查你的資料是否有效、實用。 (2)忘記歸一化。 (3)排除異常點 。 (4)包括異常點。 (5)忽視季節性。考慮一天中不同時間、一週中星期幾、一年中不同月份對資料的影響。 (6)拋開基數侈談增長。 (7)資料嘔吐。如果你不知道什麼資料對你更重要,那麼即使你的資料統計版再大也沒有用。 (8)謊報軍情的指標

。對異常資料的識別閾值設定的過於敏感導致警報不停。 (9)“不是在這兒收集的”綜合徵。多來源的資料相互結合 (10)關注噪音

精益創業與大願景