機器學習中的基礎知識(入門上篇)
前面我們已經給大家講述了很多有關機器學習的概念,這些概念都是十分重要的,我們如果要學習人工智能的話就需要重視這些知識。在這篇文章我們接著給大家介紹機器學習中的基礎知識,希望這篇文章能夠給大家帶來幫助。
(1)正則化就是對模型復雜度的懲罰。正則化幫助防止過擬合。正則化包括不同種類:L1 正則化、L2 正則化、dropout正則化。
(2)正則化率就是一種標量級,用lambda來表示,指正則函數的相對重要性。
(3)表征就是將數據映射到有用特征的過程。
(4)根目錄就是指定放置 TensorFlow 檢查點文件子目錄和多個模型的事件文件的目錄。?
(5)均方根誤差就是均方誤差的平方根。
(6)Saver就是負責存儲模型檢查點文件的 TensorFlow 對象。
(7)縮放就是特征工程中常用的操作,用於控制特征值區間,使之與數據集中其他特征的區間匹配。
(8)序列模型就是輸入具有序列依賴性的模型。
(9)會話就是保持 TensorFlow 程序的狀態。
(10)Sigmoid 函數就是把logistic 或多項式回歸輸出映射到概率的函數,返回的值在 0 到 1 之間。
(11)稀疏特征的值主要為 0 或空的特征向量。
(12)平方損失就是線性回歸中使用的損失函數。該函數計算模型對標註樣本的預測值和標簽真正值之間差的平方。在平方之後,該損失函數擴大了不良預測的影響。
(13)靜態模型就是離線訓練的模型。
(14)穩態就是數據集中的一種數據屬性,數據分布在一或多個維度中保持不變。通常情況下,維度是時間,意味著具備平穩性的數據不會隨著時間發生變化。
(15)權重就是線性模型中的特征系數,或者深度網絡中的邊緣。線性模型的訓練目標是為每個特征確定一個完美的權重。如果權重為 0,則對應的特征對模型而言是無用的。
(16)無標簽樣本就是包含特征但沒有標簽的樣本。無標簽樣本是推斷的輸入。在半監督學習和無監督學習的訓練過程中,通常使用無標簽樣本。
(17)測試集是數據集的子集。模型經過驗證集初步測試之後,使用測試集對模型進行測試。可與訓練集和驗證集對照閱讀。
我們在這篇文章中給大家介紹了很多的內容,雖然都是機器學習中比較簡單的知識,但萬丈高樓平地起,我們一定要一步步把基礎打牢固。希望這篇文章能夠給大家帶來幫助。
機器學習中的基礎知識(入門上篇)