機器學習公開課筆記第九周之大數據梯度下降算法

阿新 • • 發佈：2017-05-08

機器學習 nbsp gradient min 三種依次再看獲得 mini

一，隨機梯度下降法(Stochastic Gradient Descent)

當訓練集很大且使用普通梯度下降法(Batch Gradient Descent)時，因為每一次$\theta$的更新，計算微分項時把訓練集的所有數據都叠代一遍，所以速度會很慢

技術分享

批量梯度下降法是一次性向計算m組數據的微分，一次更新$\theta$，計算m組數據的微分時，用的是同一個$\theta$，會獲得全局最小值

隨機梯度下降法依次計算亂序的m組數據的微分，m次更新$\theta$，計算m組數據的微分時，用的是上一組數組更新完的$\theta$，會獲得非常接近於全局最小值的局部最小值

技術分享

一般叠代1-10次

技術分享

二，小批量梯度下降法(Mini-Batch Gradient Descent)

三種梯度下降法對比

技術分享

小批量梯度下降法就是一次更新b(一般是10,2~100d都可以)組數據，更新$ \lceil \frac{m}{b} \rceil$，介於隨機梯度下降法和批量梯度下降法之間

小批量梯度下降法比隨機梯度下降法速度快是因為更新$\theta$的頻率快，比隨機梯度下降法快是因為計算微分的時候可以向量化運算加速(即矩陣相乘)

技術分享

三，驗證代價函數收斂

在每次更新$\theta$前先計算$Cost(\theta, (x^{(i)}, y^{(i)}))$

因為隨機梯度下降法每次更新$\theta$，並不能保證代價函數$Cost(\theta, (x^{(i)}, y^{(i)}))$變小，只能保證總體震蕩上變小，所以我們只需最近1000個數據$Cost(\theta, (x^{(i)}, y^{(i)}))$的平均值

技術分享

上面兩副圖是比較正常的隨機梯度下降圖，下左需要提高樣例數(1000->5000)再看看是否收斂，下右明顯單調遞增，選擇更小的學習速率$\alpha$或者更改特征試試

技術分享

我們還可以動態修改學習速率來使代價函數收斂，隨著叠代次數增加而減少

$\alpha = \frac{const1}{iterationNumber + const2}$

技術分享

四，在線學習

在線學習就是在沒有預先準備好的數據集的情況下，有數據流實時給予學習模型，實時更新$\theta$，優點

1，不需要保存大量本地數據

2，實時根據數據的特征更改$\theta$

其實和隨機梯度下降法類似

技術分享

在線學習其他例子，可以根據用戶搜索的關鍵詞特征，來實時學習反饋結果，在根據用戶的點擊來更新$\theta$，如

技術分享

機器學習公開課筆記第九周之大數據梯度下降算法

機器學習 nbsp gradient min 三種依次再看獲得 mini 一，隨機梯度下降法(Stochastic Gradient Descent) 當訓練集很大且使用普通梯度下降法(Batch Gradient Descent)時，因為每一次$\theta$

廣義線性模型 - Andrew Ng機器學習公開課筆記1.6

sans luci art 能夠 tro ron 便是 import grand 在分類問題中我們如果：他們都是廣義線性模型中的一個樣例，在理解廣義線性模型之前須要先理解指數分布族。指數分

斯坦福機器學習公開課筆記十三推薦系統

也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！授課老師：Andrew Ng1、problem formulation(問題產生)在平時購物的時候我們都會看到網站把向我們推薦的商品放在醒目位置，其實這就是推薦

斯坦福機器學習公開課筆記(十五)--[應用]照片OCR技術

1、problem description and pipeline(問題描述和流水線) OCR是optical character recognition的縮寫，翻譯過來就是光學字元辨識。照片中的OCR技術其實就是識別中照片中存在的字元，例如下面這幅圖：關於過程

斯坦福機器學習公開課筆記(十三)--推薦系統

授課老師：Andrew Ng 1、problem formulation(問題產生) 在平時購物的時候我們都會看到網站把向我們推薦的商品放在醒目位置，其實這就是推薦系統。現在考慮一個電影推薦系統的例子，我們擁有一些使用者對於一些電影的評分，如下：從上面可以看到，使

機器學習公開課筆記(8)：k-means聚類和PCA降維

K-Means演算法非監督式學習對一組無標籤的資料試圖發現其內在的結構，主要用途包括：市場劃分（Market Segmentation）社交網路分析（Social Network Analysis）管理計算機叢集（Organize Computer Clusters）天文學資料分析（A

機器學習公開課筆記(7)：支援向量機

支援向量機(Support Vector Machine, SVM) 考慮logistic迴歸，對於$y=1$的資料，我們希望其$h_\theta(x) \approx 1$，相應的$\theta^Tx \gg 0$; 對於$y=0$的資料，我們希望$h_\theta(x) \approx 0$，相應的$\

機器學習公開課筆記(1)：機器學習簡介及一元線性迴歸

初步介紹監督式學習: 給定資料集並且知道其正確的輸出應該是怎麼樣的，即有反饋（feedback），分為迴歸（Regressioin）: map輸入到連續的輸出值。分類（Classification）：map輸出到離散的輸出值。非監督式學習: 給定資料集，並不知道其正確的輸出是什麼，

機器學習公開課筆記(6)：應用機器學習的建議

應用機器學習的建議 1. 評估學習演算法在實際中應用學習演算法時，如何評估一個學習演算法的好壞？進一步地，如果學習的演算法的效果不太好，如何改進學習演算法？例如，對於一個簡單的線性擬合模型，改進演算法效果的策略包括：採用更多的訓練例項訓練模型採用更小的特徵集合增加額外的特徵嘗試高次項

機器學習公開課筆記(10)：大規模機器學習

批梯度下降 (Batch Gradient Descent) 以線性迴歸為例，用梯度下降演算法進行引數更新的公式為$$\theta_j=\theta_j-\alpha\frac{1}{m}\sum\limits_{i=1}^{m}(h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}$$可

機器學習公開課筆記(9)：異常檢測和推薦系統

異常檢測(Anomaly Detection) 基本假設：多數情況下資料點落入正常的取值範圍，但是當異常行為發生時，資料點的取值落入正常取值範圍之外（如圖1所示）。所以可以利用高斯分佈，計算行為發生的概率，如果是概率小於給定閾值，則認為發生了異常行為。基本過程是利用訓練資料點建立模型$p(x)$，對於新的資

機器學習公開課筆記(5)：神經網路(Neural Network)——學習

這一章可能是Andrew Ng講得最不清楚的一章，為什麼這麼說呢？這一章主要講後向傳播(Backpropagration, BP)演算法，Ng花了一大半的時間在講如何計算誤差項$\delta$，如何計算$\Delta$的矩陣，以及如何用Matlab去實現後向傳播，然而最關鍵的問題——為什麼要這麼計算？前面計算

機器學習公開課筆記(2)：多元線性迴歸

多元線性迴歸一元線性迴歸只有一個特徵$x$，而多元線性迴歸可以有多個特徵$x_1, x_2, \ldots, x_n$ 假設 (Hypothesis)：$h_\theta(x)=\theta^Tx=\theta_0x_0+\theta_1x_1+\ldots+\theta_nx_n$ 引數 (Para

機器學習公開課筆記(4)：神經網路(Neural Network)——表示

動機(Motivation) 對於非線性分類問題，如果用多元線性迴歸進行分類，需要構造許多高次項，導致特徵特多學習引數過多，從而複雜度太高。神經網路(Neural Network) 一個簡單的神經網路如下圖所示，每一個圓圈表示一個神經元，每個神經元接收上一層神經元的輸出作為其輸入，同時其輸出訊號到下一

斯坦福機器學習公開課筆記(一)--單變數線性迴歸

授課老師：Andrew Ng 1、model representation(建立模型) 考慮一個問題，如果給定一些房屋售價和房屋面積的資料，現在要預測給定其他面積時的房屋售價，那該怎麼辦？其實這是一個線性迴歸問題，給定的資料作為訓練樣本，用其訓練得到一個表示售價和麵積關

吳恩達機器學習公開課學習筆記（一）

吳恩達機器學習公開課學習筆記（一）一些規範表達形式線性迴歸／單變數線性迴歸代價函式公開課連結： https://study.163.com/course/courseLearn.htm?courseId=1004570029#/lea

斯坦福機器學習公開課--整理筆記（…

跟老闆聊了很久之後，決定換一個研究方向，本來想專門寫一篇博文說說資料探勘與機器學習，後來轉念也想也算了，畢竟之前還是有很多可以用上的知識，這幾天準備把Andrew大牛的機器學習公開課重新刷一遍，簡單做一下筆記好了。第一課是基本介紹，略過。第二課：監督學習應用.梯度下降：這節課主要探究的是監督

【問鏈-EOS公開課】第九課 EOS 資料庫與持久化 API(二)

上次的文章詳細講解了 EOS 資料庫的架構，本文將以官方示例為基礎，詳解 EOS 資料庫的開發實戰。基本步驟在智慧合約裡與 EOS 資料庫互動，首先要定義儲存的資料：定義物件：具體就是定義一個 C++ 類或者 C++ 結構體，資料表就由一個個物件組成。定

【Andrew NG 機器學習公開課】CS229：Introduction、Linear Regression

這份筆記來源於Andrew NG在Coursera上的公開課和講義。 Introduction 機器學習問題（一）有監督學習（Supervised Learning）基本思想是：given the right answer for each example i

斯坦福機器學習公開課

視訊 http://open.163.com/movie/2008/1/M/C/M6SGF6VB4_M6SGHFBMC.html 相關筆記 http://www.cnblogs.com/LeftNotEasy/archive/2010/12/05/mathmatic_in

機器學習公開課筆記第九周之大數據梯度下降算法

相關推薦