【ML_Algorithm 1】線性迴歸——演算法推導及程式碼實現

阿新 • • 發佈：2018-12-02

：：：：：：：：線性迴歸：：：：：：：：

第一式

第二式

從式一到式二，需要新增一個 $x_{0}$ 項，其中 $x_{0}$ 為 $x_{0}$ = 1 的常數量。只是為了容易寫成程式碼而已。

真實值=預測值+誤差（誤差是獨立且具有相同的分佈，通常認為服從均值為0的方差為 $\theta ^{2}$ 的高斯分佈。）

此式意思是要找到一個θ值使得該θ與x的組合完之後，使得組合值接近y真實值的概率最大化。

為了使得概率最大，我們用到了似然函式。

我們所希望的到的L(θ)的值是越大越好——代表了所有的y(i)與其真實值都是儘可能相等的。擊球什麼樣的θ可以使得L(θ)的整體值是最大的。

為了使得求解變得簡單一些，我們引入對數似然函式 l(θ) = ln L(θ)

牢記，咱們要求的是似然函式L(θ)的值儘可能大，也就是使對數似然函式l(θ)的最大值，通過化簡的到上式，所以咱們要做的就是使右式J(θ)值最小。！

關於J(θ)的求解：

（上面第二步是對 θ 求偏導操作，矩陣求導不做解釋，不過可以從上圖看出一二）

#以下程式碼是對以上原理的簡單應用。目前我的環境尚未搭建妥當，所以還沒有去跑程式碼，先碼在這裡，等之後參考

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets

class LinearRegression():
    def __init__(self):
        self.w = None
    def fit(self,X,y):
        #訓練階段
        #Insert constant ones for bias weights
        print (X.shape)
        #x0 = 1 
        X=np.insert(X,0,1,axis=1)
        print (X.shape)
        #對X的轉置取逆操作。
        X_ = np.linalg.iniv(X.T.dot(X))
        self.w = X_.dot(X.T).dot(y)
    def predict(self,X):
        #測試階段
        #Insert constant ones for bias weights
        X = np.insert(X,0,1,axis=1)
        y_pred = X.dot(self.w)
        return y_pred

def mean_squared_error(y_true, ypred):
    mse = np.mean(np.power(y_true - y_pred, 2))
    return mse


def main():
    #Load the diabetes dataset
    diabetes = datasets.load_diabetes()
    
    #Use only one feature
    X = diabetes.data[:, np.newaxis, 2]
    print(X.shape)
    
    #Split the data into training/testing sets
    x_train, x_test = X[:-20],X[-20:]
    
    #Split the targets into training/testing sets
    y_train, y_test = diabetes.target[:-20], diabetes.target[-20:]
    
    clf = LinearRegression()
    clf.fit(x_train, y_train)
    y_pred = clf.predict(x_test)
    
    #Print the mean squared error
    print ("Mean Souared Error:"mean_squared_error(y_test, y_pred))
    
    #Plot the results
    plt.scatter(x_test[:,0], y_test, color='black')
    plt.plot(x_test[:,0], y_pred, color='blue',linewidth=3)
    plt.show()

參考：

機器學習課程——唐老師

【ML_Algorithm 1】線性迴歸——演算法推導及程式碼實現

：：：：：：：：線性迴歸：：：：：：：：第一式第二式從式一到式二，需要新增一個

【機器學習】線性迴歸演算法的過擬合比較

回顧過擬合與欠擬合主要介紹了什麼是欠擬合什麼是過擬合對抗過擬合主要介紹了線性迴歸中對抗過擬合的方法，主要包括：L1-norm的LASSO迴歸、L2-norm的Ridge迴歸，此外還有一個沒有提到，L1-norm和L2-norm結合的Elasitc Net(彈性網

邏輯迴歸演算法推導及Python實現

寫在前面： 1、好多邏輯迴歸的演算法推導要麼直接省略，要麼寫的比較難以看懂，比如寫成矩陣求導，繁難難懂，本文進行推導，會鏈式求導法則應當就能看懂 2、本文參考若干文章，寫在附註處，如果參考未寫引用，還望提出 2、本文後續可能不定時更新，如有錯誤，歡迎提出一、最大似

【ML模型詳細推導1】- 線性迴歸

線性迴歸 0. 資料集和目標 1. 模型 2. 策略 3. 演算法(模型求解) 3.1 正規方程法 3.2 梯度下降法 4. 廣義線性模型學習過程主要順著周志華《機器學習》第三章線性模型

【ML_Algorithm 2 】邏輯迴歸(Logistic Regression)——演算法推導

邏輯迴歸其實做的是一個分類的事怎麼樣做到的分類：（可以輸入任何數，該式可以轉換成一個0或1的取值）該演算法實際上是用迴歸的方法轉把資料換成了分類（二分類）的問題。此式：咱們要找出來一個θ，使該θ和x進行組合之後，使得得到的值和y的真實值相

【番外】線性迴歸和邏輯迴歸的 MLE 視角

線性迴歸令 z = w

【學習筆記】線性迴歸

人們早就知道(並且找到了計算方法)，相比涼爽的天氣，在溫度較高的時候，蟋蟀鳴叫更為頻繁。這裡文件給出了我們圖片，我們拿一個直尺很容易就能畫一條線來近似這種關係。雖然該直線並沒有精確的穿過每個點，但是我們還是能總結出大概的關係: y = w*x + b 這裡的 y

011.線性迴歸演算法推導

預備知識高斯分佈一維正態分佈似然函式 PS: 之前一直比較糾結，最大似然估計的定義為什麼是概率密度函式（或概率質量函式）的累積，看了上面的似然函式中的計算例項才逐漸明白。

【Machine Learning 】線性迴歸

線性迴歸我們可以通過測量損耗來衡量線路的適合程度。線性迴歸的目標是最小化損失。為了找到最佳擬合線，我們嘗試找到最小化損失的b值（截距）和m值（斜率）。收斂是指引數在每次迭代時停止變化時的引數學習率是指每次迭代時引數的變化程度。我們可以

【深度學習】線性迴歸（一）原理及python從0開始實現

文章目錄線性迴歸單個屬性的情況多元線性迴歸廣義線性模型實驗資料集介紹相關連結 Python實現環境編碼

【深度學習】線性迴歸（三）使用MXNet深度學習框架實現線性迴歸

文章目錄概述程式碼概述這篇文章使用MXNet深度學習框架中的Gluon包實現小批量隨機梯度下降的線性迴歸問題。可以參考我的上一篇文章【深度學習】線性迴歸（二）小批量隨機梯度下降及其python實現。主要包

【深度學習】線性迴歸（二）小批量隨機梯度下降及其python實現

文章目錄概述小批量隨機梯度下降解析解和數值解小批量隨機梯度下降 python實現需要的先驗知識程式碼和實驗概述本文

機器學習入門之線性迴歸演算法推導

心血來潮，想將所學到的知識寫篇部落格，筆者所研究的方向為機器學習，剛學習的時候，走了很多彎路，看的書不少，在推導機器學習一些演算法時候遇到了不少困難，查了不少資料，在剛才學的時候，有很多公式推導起來很困難，或者說大多數人都會遇到這樣的問題，本部落格目的就是解決在機器學習公式推導過程中遇到的問

線性迴歸演算法推導（Linear Regression）

在現實生活中普遍存在著變數之間的關係，有確定的和非確定的。確定關係指的是變數之間可以使用函式關係式表示，還有一種是屬於非確定的（相關），比如人的身高和體重，一樣的身高體重是不一樣的。線性迴歸： 1

【機器學習】線性迴歸模型分析

具體原理不講了，線性迴歸模型，代價損失函式 COST是均方誤差，梯度下降方法。屬性取值。模型的屬性取值設定需要根據每一個引數的取值範圍來確定，將所有的屬性的取值統一正則化normalization，統一規定在0~1的範圍，或者-1~1的範圍內，這樣在進行線性迴歸時不會造成

【機器學習】線性迴歸+程式碼實現

參考：《機器學習實戰》原始碼地址以及資料：https://github.com/JieruZhang/MachineLearninginAction_src 1. 標準線性迴歸(LR) y

【ML_Preparation 1 】Anaconda 獲取、安裝及相關庫的安裝

Anaconda 的獲取、安裝使用Anaconda 安裝 python 環境，國內映象地址：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 該映象站點基本涵蓋所有 Anaconda 版本。自行下載安裝即可。速度要比國外站點快很很

【機器學習】Apriori演算法——原理及程式碼實現（Python版）

Apriopri演算法 Apriori演算法在資料探勘中應用較為廣泛，常用來挖掘屬性與結果之間的相關程度。對於這種尋找資料內部關聯關係的做法，我們稱之為：關聯分析或者關聯規則學習。而Apriori演算法就是其中非常著名的演算法之一。關聯分析，主要是通過演算法在大規模資料集中尋找頻繁項集和關聯規則。

【資料結構】連結串列的原理及java實現

一：單向連結串列基本介紹連結串列是一種資料結構，和陣列同級。比如，Java中我們使用的ArrayList，其實現原理是陣列。而LinkedList的實現原理就是連結串列了。連結串列在進行迴圈遍歷時效率不高，但是插入和刪除時優勢明顯。下面對單向連結串列做一個介

【機器學習】分類決策樹基本介紹+程式碼實現

參考：https://blog.csdn.net/u012351768/article/details/73469813 1.基礎知識基於特徵對例項進行分類。優點：複雜度低，輸出結果易於理解，缺失中間值不敏感，可處理不相關特徵資料。缺點：過度匹配。適用資料型別：標稱和

【ML_Algorithm 1】線性迴歸——演算法推導及程式碼實現

：：：：：：：：線性迴歸：：：：：：：：

第一式

第二式

相關推薦