機器學習中的基礎知識（入門上篇）

阿新 • • 發佈：2019-02-16

數據分布指正 bubuko 擴大映射 flow 正則化放置工程

技術分享圖片

前面我們已經給大家講述了很多有關機器學習的概念，這些概念都是十分重要的，我們如果要學習人工智能的話就需要重視這些知識。在這篇文章我們接著給大家介紹機器學習中的基礎知識，希望這篇文章能夠給大家帶來幫助。

（1）正則化就是對模型復雜度的懲罰。正則化幫助防止過擬合。正則化包括不同種類：L1 正則化、L2 正則化、dropout正則化。

（2）正則化率就是一種標量級，用lambda來表示，指正則函數的相對重要性。

（3）表征就是將數據映射到有用特征的過程。

（4）根目錄就是指定放置 TensorFlow 檢查點文件子目錄和多個模型的事件文件的目錄。?

（5）均方根誤差就是均方誤差的平方根。

（6）Saver就是負責存儲模型檢查點文件的 TensorFlow 對象。

（7）縮放就是特征工程中常用的操作，用於控制特征值區間，使之與數據集中其他特征的區間匹配。

（8）序列模型就是輸入具有序列依賴性的模型。

（9）會話就是保持 TensorFlow 程序的狀態。

（10）Sigmoid 函數就是把logistic 或多項式回歸輸出映射到概率的函數，返回的值在 0 到 1 之間。

（11）稀疏特征的值主要為 0 或空的特征向量。

（12）平方損失就是線性回歸中使用的損失函數。該函數計算模型對標註樣本的預測值和標簽真正值之間差的平方。在平方之後，該損失函數擴大了不良預測的影響。

（13）靜態模型就是離線訓練的模型。

（14）穩態就是數據集中的一種數據屬性，數據分布在一或多個維度中保持不變。通常情況下，維度是時間，意味著具備平穩性的數據不會隨著時間發生變化。

（15）權重就是線性模型中的特征系數，或者深度網絡中的邊緣。線性模型的訓練目標是為每個特征確定一個完美的權重。如果權重為 0，則對應的特征對模型而言是無用的。

（16）無標簽樣本就是包含特征但沒有標簽的樣本。無標簽樣本是推斷的輸入。在半監督學習和無監督學習的訓練過程中，通常使用無標簽樣本。

（17）測試集是數據集的子集。模型經過驗證集初步測試之後，使用測試集對模型進行測試。可與訓練集和驗證集對照閱讀。

我們在這篇文章中給大家介紹了很多的內容，雖然都是機器學習中比較簡單的知識，但萬丈高樓平地起，我們一定要一步步把基礎打牢固。希望這篇文章能夠給大家帶來幫助。

機器學習中的基礎知識（入門上篇）

數據分布指正 bubuko 擴大映射 flow 正則化放置工程前面我們已經給大家講述了很多有關機器學習的概念，這些概念都是十分重要的，我們如果要學習人工智能的話就需要重視這些知識。在這篇文章我們接著給大家介紹機器學習中的基礎知識，希望這篇文章能夠給大家帶來幫助。