機器學習八股文-1

阿新 • • 發佈：2021-08-19

作者：穆文
連結：https://www.zhihu.com/question/62482926/answer/233521233
來源：知乎
著作權歸作者所有。商業轉載請聯絡作者獲得授權，非商業轉載請註明出處。

過擬合欠擬合（舉幾個例子讓判斷下，順便問問交叉驗證的目的、超引數搜尋方法、EarlyStopping）、L1正則和L2正則的做法、正則化背後的思想（順便問問BatchNorm、Covariance Shift）、L1正則產生稀疏解原理、邏輯迴歸為何線性模型（順便問問LR如何解決低維不可分、從圖模型角度看LR和樸素貝葉斯和無監督）、幾種引數估計方法MLE/MAP/貝葉斯的聯絡和區別、簡單說下SVM的支援向量（順便問問KKT條件、為何對偶、核的通俗理解）、 GBDT隨機森林能否並行（順便問問bagging boosting）、生成模型判別模型舉個例子、聚類方法的掌握（順便問問Kmeans的EM推導思路、譜聚類和Graph-cut的理解）、梯度下降類方法和牛頓類方法的區別（順便問問Adam、L-BFGS的思路）、半監督的思想（順便問問一些特定半監督演算法是如何利用無標籤資料的、從MAP角度看半監督）、常見的分類模型的評價指標（順便問問交叉熵、ROC如何繪製、AUC的物理含義、類別不均衡樣本）

CNN中卷積操作和卷積核作用、maxpooling作用、卷積層與全連線層的聯絡、梯度爆炸和消失的概念（順便問問神經網路權值初始化的方法、為何能減緩梯度爆炸消失、CNN中有哪些解決辦法、LSTM如何解決的、如何梯度裁剪、dropout如何用在RNN系列網路中、dropout防止過擬合）、為何卷積可以用在影象/語音/語句上（順便問問channel在不同型別資料來源中的含義）
如果面試者跟我一樣做NLP、推薦系統，我會繼續追問 CRF跟邏輯迴歸最大熵模型的關係、CRF的優化方法、CRF和MRF的聯絡、HMM和CRF的關係（順便問問樸素貝葉斯和HMM的聯絡、LSTM+CRF 用於序列標註的原理、CRF的點函式和邊函式、CRF的經驗分佈）、WordEmbedding的幾種常用方法和原理（順便問問language model、perplexity評價指標、word2vec跟Glove的異同）、topic model說一說、為何CNN能用在文字分類、syntactic和semantic問題舉例、常見Sentence embedding方法、注意力機制（順便問問注意力機制的幾種不同情形、為何引入、seq2seq原理）、序列標註的評價指標、語義消歧的做法、常見的跟word有關的特徵、factorization machine、常見矩陣分解模型、如何把分類模型用於商品推薦（包括資料集劃分、模型驗證等）、序列學習、wide&deep model（順便問問為何wide和deep)

機器學習八股文-1

作者：穆文連結：https://www.zhihu.com/question/62482926/answer/233521233來源：知乎著作權歸作者所有。商業轉載請聯絡作者獲得授權，非商業轉載請註明出處。

李巨集毅機器學習筆記1：Regression

損失函式梯度下降隨機初始化起始位w0在w0處對損失函式求導（偏導）w1=w0-學習率*w0處的倒數一直重複計算，直到導數為0，或者達到最大迭代次數。

機器學習——【1】概述篇

機器學習——【1】概述篇 1.1 機器學習與人工智慧，深度學習 1.1.1 機器學習和人工智慧，深度學習的關係

吳恩達機器學習筆記1 初識機器學習

本章節主要介紹了監督學習和無監督學習的概念與舉例，適合小白入門機器學習。

機器學習（1）

技術標籤：機器學習機器學習python資料分析 Marvin Lee Minsky 人工智慧機器學習深度學習場景：機器寫新聞人臉識別智慧診斷信貸需求預測，店鋪銷量預測

機器學習2.1-機器學習中的特徵選擇

特徵提取演算法特徵提取演算法分為特徵選擇和特徵抽取兩大類特徵選擇常採用特徵選擇方法。常見的六種特徵選擇方法：

機器學習（1）--基礎知識

基礎知識基本術語有所瞭解：資料集： 100個西瓜樣本：一個西瓜特徵向量（我們把一個示例（樣本）稱為一個特徵向量）

圖解機器學習總結——1、基本概念

序言：近期主要幫同事講解《圖解機器學習》，剛拿到這本書覺得內容相比較平常使用的機器學習演算法，很多地方講解得比較奇怪，在認真的讀完後，覺得還是有很多重要的東西，因此讀了書就想把知識點整理出來，加上一些

【機器學習】數值分析（1）—— 任意方程求根

任意方程求根簡介方程和函式是代數數學中最為重要的內容之一，從初中直到大學，我們都在研究著方程與函式，甚至我們將圖形代數化，從而發展出了代數幾何、解析幾何的內容。而在方程與函式中，我們研究其性質最多的

1-機器學習-機器學習基礎

sklearn的資料集資料集劃分資料集介面介紹資料集劃分前提：機器學習就是從資料中自動分析獲得規律，並利用規律對未知資料進行預測。換句話說，我們的模型一定是要經過樣本資料對其進行訓練，才可以對未知資

《機器學習 caffe 環境搭建——redhat7.1 和 caffe 的 python 介面編譯》

機器學習 caffe 環境搭建——redhat7.1 和 caffe 的 python 介面編譯相信看這篇文章的都知道 caffe 是幹嘛的了，無非就是深度學習、神經網路、計算機視覺、人工智慧這些，這個我就不多介紹了，下面說說我

機器學習-文字分類（1）之獨熱編碼、詞袋模型、N-gram、TF-IDF

1、one-hot 一般是針對於標籤而言，比如現在有貓：0，狗：1，人：2，船：3，車：4這五類，那麼就有：

【機器學習與R語言】1-機器學習簡介

目錄1.基本概念2.選擇機器學習演算法3.使用R進行機器學習 1.基本概念機器學習：發明演算法將資料轉化為智慧行為

Python機器學習預測分析核心演算法1

最近在學習Michael Bowles著的《Python 機器學習預測分析核心演算法》，記錄一下學習過程。

RHCE 6.0 學習筆記-1 虛擬機器安裝RHEL 6.0 全圖解

1. 使用VMware安裝虛擬機器 2. 選擇“Customer”安裝 3. 選擇“之後安裝作業系統”繼續安裝：

機器學習五：Deep Learning深度學習1

前情提要由邏輯迴歸演算法我們引出了深度學習，請參考https://blog.csdn.net/weixin_42744909/article/details/108954890

機器學習筆記 Day 1

機器學習是什麼機器學習的兩種定義：在無需具體的程式設計規則的條件下，給予計算機以學習的能力計算機程式從經驗 E 中學習某些型別的任務 T 和效能度量 P，如果它在任務 T 中的效能(以P度量)隨著經驗E的

Java虛擬機器學習(1)—Java記憶體區域劃分

Java與C++之間有一堵由記憶體動態分配和垃圾收集技術所圍成的高牆，牆外面的人想進去，牆裡面的人卻想出來。

ml-6-1-應用機器學習的建議Advice for Applying Machine Learning

應用機器學習的建議Advice for Applying Machine Learning Deciding What to Try Next 具體來講，我將重點關注的問題是假如你在開發一個機器學習系統，或者想試著改進一個機器學習系統的效能，你應如何決定

機器學習回顧篇（1）：梯度下降法

注：本系列所有部落格將持續更新併發布在github上，您可以通過github下載本系列所有文章筆記檔案