1. 程式人生 > >機器學習中的基礎知識(入門上篇)

機器學習中的基礎知識(入門上篇)

數據分布 指正 bubuko 擴大 映射 flow 正則化 放置 工程

技術分享圖片

前面我們已經給大家講述了很多有關機器學習的概念,這些概念都是十分重要的,我們如果要學習人工智能的話就需要重視這些知識。在這篇文章我們接著給大家介紹機器學習中的基礎知識,希望這篇文章能夠給大家帶來幫助。

(1)正則化就是對模型復雜度的懲罰。正則化幫助防止過擬合。正則化包括不同種類:L1 正則化、L2 正則化、dropout正則化。

(2)正則化率就是一種標量級,用lambda來表示,指正則函數的相對重要性。

(3)表征就是將數據映射到有用特征的過程。

(4)根目錄就是指定放置 TensorFlow 檢查點文件子目錄和多個模型的事件文件的目錄。?

(5)均方根誤差就是均方誤差的平方根。

(6)Saver就是負責存儲模型檢查點文件的 TensorFlow 對象。

(7)縮放就是特征工程中常用的操作,用於控制特征值區間,使之與數據集中其他特征的區間匹配。

(8)序列模型就是輸入具有序列依賴性的模型。

(9)會話就是保持 TensorFlow 程序的狀態。

(10)Sigmoid 函數就是把logistic 或多項式回歸輸出映射到概率的函數,返回的值在 0 到 1 之間。

(11)稀疏特征的值主要為 0 或空的特征向量。

(12)平方損失就是線性回歸中使用的損失函數。該函數計算模型對標註樣本的預測值和標簽真正值之間差的平方。在平方之後,該損失函數擴大了不良預測的影響。

(13)靜態模型就是離線訓練的模型。

(14)穩態就是數據集中的一種數據屬性,數據分布在一或多個維度中保持不變。通常情況下,維度是時間,意味著具備平穩性的數據不會隨著時間發生變化。

(15)權重就是線性模型中的特征系數,或者深度網絡中的邊緣。線性模型的訓練目標是為每個特征確定一個完美的權重。如果權重為 0,則對應的特征對模型而言是無用的。

(16)無標簽樣本就是包含特征但沒有標簽的樣本。無標簽樣本是推斷的輸入。在半監督學習和無監督學習的訓練過程中,通常使用無標簽樣本。

(17)測試集是數據集的子集。模型經過驗證集初步測試之後,使用測試集對模型進行測試。可與訓練集和驗證集對照閱讀。

我們在這篇文章中給大家介紹了很多的內容,雖然都是機器學習中比較簡單的知識,但萬丈高樓平地起,我們一定要一步步把基礎打牢固。希望這篇文章能夠給大家帶來幫助。

機器學習中的基礎知識(入門上篇)