線性回歸（一）

阿新 • • 發佈：2019-03-10

.com fonts 應用 eight gre 垂直三維梯度地理

什麽是機器學習？

機器學習：研究如何通過計算的手段，利用經驗來改善系統自身的性能。

機器學習分為監督學習和非監督學習。

監督學習（Supervised learning）

從給定的訓練數據集中學習出一個函數（模型參數），當新的數據到來時，可以根據這個函數預測結果。監督學習的訓練集要求包括輸入輸出，也可以說是特征和目標。

常見的有監督學習算法：回歸分析和統計分類

技術分享圖片

非監督學習（Unsupervised learning）

輸入數據沒有被標記，也沒有確定的結果。樣本數據類別未知，需要根據樣本間的相似性對樣本集進行分類（聚類，clustering

）試圖使類內差距最小化，類間差距最大化。

在實際應用中，不少情況下無法預先知道樣本的標簽，也就是說沒有訓練樣本對應的類別，因而只能從原先沒有樣本標簽的樣本集開始學習分類器設計。

線性回歸

在對機器學習這門學科有了一個基本的認識後，我們就要正式開始進行模型算法的學習了。

在線性回歸這部分，這篇博客主要從以下幾個部分來討論：

模型定義
損失函數
參數估計

以下筆記來自吳聞達老師的機器學習視頻。

模型定義

技術分享圖片

以上是監督學習問題的圖示描述，我們的目標是，給定訓練集，學習函數h：X→Y，使得h（x）是對於y有較好的預測值。

h（x）代表的是一個假設集合（Hypothesis ），我們要做的就是從這個假設集合中找出預測效果最好的那一個假設。

技術分享圖片

損失函數（Cost Function）

之前舉的例子，關於房價的預測問題，是一個單變量的回歸問題，輸入數據只有x維度為1，

我們建立的模型是，我們的目標是讓這個直線盡可能的擬合所有數據，

即從數據的中心穿過，讓我們的每個預測值h（x）與我們的已知數值y盡可能的接近。

那麽，我們應該怎麽選擇最好的模型呢？通過求解參數theta1和theta2.

技術分享圖片

我們可以通過使用 cost function(損失函數)來測量我們的假設的準確性。這需要使用來自x的輸入

和實際輸出y的假設的所有結果的平均差（實際上是平均值的更好的版本），如下。

技術分享圖片

說明：其實損失函數 J 計算的是h（x）與真實值y之間的垂直距離的平方和均值。

關於為什麽多一個1/2的問題，是為了以後求導方便，不用太在意這個。

技術分享圖片

為了問題描述的方便，首先使用上圖右邊的簡單模型，只有一個參數theta1.

下圖是對數據樣本點”X“的擬合狀態，

技術分享圖片

當在上圖中我們隨意旋轉h（x），將會得到不同的 J 值，可以得到下面的關於theta1 損失函數 J 的圖像：

技術分享圖片

當同時考慮兩個參數值 theta1和theta0時，損失函數的圖像是這樣的，被稱為bowl-shape function，碗狀的

技術分享圖片

下圖的右邊是上面三維圖像的二維展示，那一圈一圈的橢圓被稱為“等高線”（類似地理上的等高線），每一個橢圓上的不同點的 J 值都是相等的，

如圖中綠色橢圓上的三個點，越靠近中心的橢圓 J 值越小。

技術分享圖片

上面左圖對應的是右圖中用綠色圓圈標註的點（theta1=800，theta0=-1.5），對應的模型h（x）的圖像，右圖中每一個不同的點，

都會在左圖中對應一個不同的圖像，如下：

技術分享圖片

當然，我們理想的情況是類似上圖的情況，我們取的（theta1，theta0）出現圖中的中心theta0=450,theta1=0.12，

在這個點可以是損失函數達到最小，趨近於0.這樣我們就求得了模型參數theta0和theta1，進而得到最佳的假設h（x）。

參數估計：

Gradient Descent（梯度下降）

我們有了假設模型h（x），和損失函數 J，現在來討論如何求得theta1和theta0的方法，梯度下降。我們的問題描述如下：

技術分享圖片

需要不斷叠代，求得使損失函數 J 達到最小的theta1和theta0.

關於梯度下降的理解：

假設你現在站在兩座山包上的其中一座，你需要以最快的速度下到山的最低處。每到達一個新的地方，

都選擇在該點處梯度最大的方向下山即可。如圖：

技術分享圖片

梯度下降算法表示如下：其中標出了梯度（藍框內）和學習率（α > 0），梯度在這裏通俗的說就是函數 J 的偏導數。

註意：梯度下降算法對局部最小值敏感，梯度下降可能收斂在局部最小，不能保證收斂到全局最小值。

技術分享圖片

說明：在計算機科學中，x：=x+y表示，先計算x+y的結果再賦值給變量x，類似先計算a=x+y，然後使x的值等於a。

下圖為梯度為正、負的情況,theta的更新是不一樣的：

技術分享圖片

關於參數更新的問題，theta1和theta2必須同時更新，下圖左邊為正解，即不能使用更新過後的theta0來進一步更新theta1

（這將是後面要講到了另一種算法）。

技術分享圖片

關於學習率α的問題：

當a過小的時候，叠代步長太小，梯度下降得太慢；

當a過大的時候，叠代步長過大，梯度無法收斂到最小值，而發生左右震蕩的現象。

技術分享圖片

當固定a時，梯度下降法依然可以收斂到最小值（局部），

技術分享圖片

因為，當我們越靠近最小值時，我們的梯度越小，反應在上圖就是越來越平緩，所以上面藍色方框中的表達式會越來越小，

然後乘上a也越來越小，證明我們叠代的步長會逐步變小，即使我們使用的是固定不變的學習率a。

Gradient Descent For Linear Regression

（在線性回歸中使用梯度下降）

技術分享圖片

其推導過程如下，分別對 J 求關於theta0和theta1的偏導數：

技術分享圖片

得到下面應用於線性回歸的梯度下降算法：

技術分享圖片

通過對以上算法的不斷叠代，我們求得了最好的假設h（x），其中紅色“x”的軌跡，就是算法叠代的過程。

技術分享圖片

線性回歸（一）

python實現線性回歸（一）原理

函數乘法學習偏移量 python實現機器線性計算梯度線性回歸是機器學習的基礎，用處非常廣泛，在日常工作中有很大作用。 1.什麽是線性回歸通過多次取點，找出符合函數的曲線，那麽就可以完成一維線性回歸。 2.數學表示是截距值，為偏移量。因為單純計算多項

線性回歸（一）

.com fonts 應用 eight gre 垂直三維梯度地理什麽是機器學習？機器學習：研究如何通過計算的手段，利用經驗來改善系統自身的性能。機器學習分為監督學習和非監督學習。監督學習（Supervised learning）

從零單排入門機器學習：線性回歸（linear regression）實踐篇

class rom enter instr function ont 線性 gin 向量線性回歸（linear regression）實踐篇之前一段時間在coursera看了Andrew ng的機器學習的課程，感覺還不錯，算是入門了。這次打算以該課程的作業

機器學習經典算法具體解釋及Python實現--線性回歸（Linear Regression）算法

ica single 方便最好的而且 == show des fun （一）認識回歸回歸是統計學中最有力的工具之中的一個。機器學習監督學習算法分為分類算法和回歸算法兩種，事實上就是依據類別標簽分布類型為離散型、連續性而定義的。顧名思義。分類算法用於離散型分布

tensorflow實現svm多分類 iris 3分類——本質上在使用梯度下降法求解線性回歸（loss是定制的而已）

points near plot asi atm lob put matplot ive # Multi-class (Nonlinear) SVM Example # # This function wll illustrate how to # implement

ML:單變量線性回歸（Linear Regression With One Variable）

one mod gre line lin 我們目的技術 ESS 模型表達（model regression）用於描述回歸問題的標記 m 訓練集（training set）中實例的數量 x 特征/輸入變量 y 目標變量/輸出變量 (x,y) 訓練集中的實例 (x(

在python中實現線性回歸（linear regression）

lsa d+ 分享圖片通過 nsq mps mile edi mfp 1 什麽是線性回歸確定因變量與多個自變量之間的關系，將其擬合成線性關系構建模型，進而預測因變量 2 線性回歸原理最小二乘法OLS（ordinary learst squares）模型的y與實際值y

機器學習---線性回歸（Machine Learning Linear Regression）

包括 rest 梯度下降法向量鞍點麻煩貝葉斯 div rem 線性回歸是機器學習中最基礎的模型，掌握了線性回歸模型，有利於以後更容易地理解其它復雜的模型。線性回歸看似簡單，但是其中包含了線性代數，微積分，概率等諸多方面的知識。讓我們先從最簡單的形式開始。

機器學習---吳恩達---Week1（機器學習概述與單變量線性回歸方程分析）

行數操作相加 vision 強化學習 machine 其余 tro ram 機器學習概述 Machine Learning: Grew out of work in AI & New capability for computers Examples:

Python 中的進程、線程、協程、同步、異步、回調（一）

互聯網科技編程一、上下文切換技術簡述在進一步之前，讓我們先回顧一下各種上下文切換技術。不過首先說明一點術語。當我們說“上下文”的時候，指的是程序在執行中的一個狀態。通常我們會用調用棧來表示這個狀態——棧記載了每個調用層級執行到哪裏，還有執行時的環境情況等所有有關的信息。當我們說“上下文切換”

【高斯消元】CDOJ1783 曜醬的線性代數課堂（一）

turn abs swap size wap n) memset efi 高斯高斯消元求逆矩陣板子。 #include<cstdio> #include<cmath> #include<algorithm> #include

第二章之集成運算放大器的線性應用基礎（一）

+= 比例 com 作用什麽是開始應用電路 ID 通過　　第一章已經介紹了有關放大器的基本概念以及最重要的思想——負反饋思想。而第二章就開始介紹最重要的放大部件——集成運算放大器的性質和應用電路分別從模型（基本電路），電壓傳輸特性（性質），線性和非線性運用（實踐）

【MySQL】通過Binary Log簡單實現數據回滾（一）

pre mage 用途 top IT cal 時間 excel var 一、前言對，沒錯，我又水了好一陣子，深刻反思寄幾。前段時間，工作項目上出於對excel等批量操作可能出現誤操作的問題，要求提供一個能夠根據操作批次進行數據回滾的能力。在開發的過程中接觸到了MySQL的

tensorflow-非線性回歸（2）

線性 tip optimizer lob rate bre multi random ide #!/usr/bin/env python2 # -*- coding: utf-8 -*- """ Created on Sat Sep 15 10:54:53 2018 @a

探究HashMap線性不安全（一）——重溫HashMap的put操作

1 void resize(int newCapacity) { 2 //使用oldTable指向擴容前的table 3 Entry[] oldTable = table; 4 int oldCapacity = oldTable.length; 5 //如果

深入理解線性迴歸演算法（一）

前言線性迴歸演算法是公眾號介紹的第一個機器學習演算法，原理比較簡單，相信大部分人對線性迴歸演算法的理解多於其他演算法。本文介紹的線性迴歸演算法包括最小二乘法和最大似然法，進而討論這兩種演算法蘊含的一些小知識，然後分析演算法的偏差和方差問題，最後總結全文。

ML—線性迴歸系列（一）—線性迴歸

Andrew Zhang Tianjin Key Laboratory of Cognitive Computing and Application Tianjin University Nov 25, 2015 本來以為線性迴歸是一個特簡單的東西，最近遇到很多基於線性迴歸的東

Apk反編譯&回編譯（一）

本篇主要講解未加固型（純混淆+簽名）apk反編譯和回編譯方法主要使用工具：ApkTool ， Smali2Java ， apk簽名工具 Apk反編譯之使用姿勢這裡使用demo.apk 作為反編譯檔案 a.安裝ApkTool，將demo.ap

Android UI布局-1.1線性布局（一）-線性布局基礎

dev 其中兩種 wid alt encoding 基本 ofo version LinearLayout，中文意思就是線性布局，是一種最簡單、最常用的布局方式，它將其中的組件以線性方式進行排列。其中有垂直和水平兩種布局方向，可以使用orientation屬性來對它的方向

為什麽要學習邏輯回歸（二）

例子圖片劃分重要性 tex 訓練 nbsp 明顯權重我們在上一篇文章中給大家介紹了在數據分析行業中為什麽要學習邏輯回歸的原因，主要的原因就是邏輯回歸是一個十分實用的工具，同時也有著自己的優點，這些優點都是十分明顯的。今天我們將繼續為大家介紹邏輯回歸的優點。學習

線性回歸（一）

什麽是機器學習？

監督學習 （Supervised learning）

線性回歸

模型定義

損失函數（Cost Function）

參數估計：

Gradient Descent（梯度下降）

Gradient Descent For Linear Regression

（在線性回歸中使用梯度下降）

相關推薦

監督學習（Supervised learning）