機器學習-常見問題積累【1】

阿新 • • 發佈：2017-08-29

屬性。積累兩種所在哪些異常缺失值問題推導

1、python和R在做數據分析時各有自己得擅長得領域，如python做時域分析得難度就遠遠比R大，因為R有非常成熟得Package!

2、數據處理：如何處理缺失數據？各種處理方法得的利弊？

3、數據處理：如何將類別型(又稱做描述型)變量轉為連續變量？如何處理有序變量？如何處理無序變量

4、數據處理：如何進行特征選擇？如何進行數據壓縮？

5、模型解釋：什麽是欠擬合？什麽是過擬合？如何處理這兩種情況？

6、模型解釋：什麽是偏差與方差分解？與欠擬合和過擬合有什麽聯系？

7、評估模型一般有哪些手段？

1）分類模型評估的方法有哪些？

2）回歸問題評估方法有哪些？

3）數據不均衡的評估方法有哪些？

8、深度學習是否比其他學習模型都好？為什麽？

9、在只有少量的有標簽數據的情況下，如何構建一個反保險欺詐系統？

10、在數據分布不均勻的情況下，是采用過采樣還是欠采樣？如何調整代價函數和閾值？

11、SVM，什麽事最大間隔分類器？什麽是kernel，如何懸著kernel?

12、為什麽K-means不適合異常值檢測？K-means和GMM是什麽關系？是否可以用FMM來直接擬合異常值？

13、如何可以得到無監督學習中的分類規則？

14、L1和L2正則化兩者有什麽不同，什麽時候采用L1，什麽時候采用L2？為什麽L1可以得到稀疏解？它們與嵌入式特征選擇有什麽聯系？

15、根據崗位準備一份項目策劃書

看懂周誌華<<機器學習>>前十章，並熟練的使用Sklearn中基礎API進行建模就可以了，勿矯枉過正，如果你的崗位不是理論型科學家崗位，不要與

數學推導死磕。

-----------------------------------------------------------------------------------------

Answer:

2、1>分析缺失值所在比例，如果某個屬性的缺失值太多，可考慮去除該屬性。

2>可以用均值、眾數、中位數、回歸值填充代替

3>用0填充代替

機器學習-常見問題積累【1】

屬性。積累兩種所在哪些異常缺失值問題推導 1、python和R在做數據分析時各有自己得擅長得領域，如python做時域分析得難度就遠遠比R大，因為R有非常成熟得Package! 2、數據處理：如何處理缺失數據？各種處理方法得的利弊？ 3、數據處理：如何將類別

Linux學習之命令【1】

active acc 同時計算機用戶名幫助理解否則解釋 Linux學習之命令【1】一·命令總覽?????? 1.基本簡單命令??????? ?1.0 pwd1.1 echo ?????????1.2 dat

機器學習資料集【轉】

500款各領域機器學習資料集,總有一個是你要找的金融美國勞工部統計局官方釋出資料：http://dataju.cn/Dataju/web/datasetInstanceDetail/139 滬深股票除權除息、配股增發全量資料，截止 2016.12.31 http://dataju.c

深度學習下海血淚史【1】AlexNet回顧

0 摘要 Hinton大神（BP演算法提出者）的學生Alex提出於2012年，主要創新和貢獻為【1】首次利用GPU和ReLU加快訓練【2】使用dropout減少過擬合【3】提出LRN層和重疊最大池化（max pooling） Alex

openCV學習之路【1】---VS2017+openCV3.4.1配置教程

我先安裝“VS2017”，後使用的vs2017自帶了包管理外掛NuGet,安裝的"opencv",而後出現了各種錯誤，再調節後，放棄了，而後參考（2）安裝“opencv”後，出現了一下這個錯誤：錯誤LNK1112模組計算機型別“x64”與目標計算機型別“x86

第四章了不起的分支和迴圈[DDT書本學習小甲魚]【1】

4.1 分支和迴圈了不起的C語言“機器碼生彙編——彙編生C——C生萬物” 打飛機遊戲框架解析 =====================參考框架============================ 載入背景音樂播放背景音樂我方飛機誕生 interval=0 while True if 使用者是

第五章列表、元組和字串[DDT書本學習小甲魚]【1】

5.1 列表：一個“打了激素”的陣列很多程式語言裡，陣列是把一大堆同類型的資料挨個擺在一起，然後通過陣列下標進行索引。 Python沒有陣列，但是Python加入了更為強大的【列表】。5.1.1 建立列表例如 number=[1,2,3,4,5] 打了激素過後例如 mix=[1,"daodantou

第五章列表、元組和字符串[DDT書本學習小甲魚]【1】

oda dao ddt 沒有 1.5 第一個 3.1 單個指定位置 5.1 列表：一個“打了激素”的數組很多編程語言裏，數組是把一大堆同類型的數據挨個擺在一起，然後通過數組下標進行索引。 Python沒有數組，但是Python加入了更為強大的【列表】。5.1.1 創建

Step 14: p5.js 程式設計基礎學習合集【1】

不知道你是否瞭解過 Processing 語言的家譜（如下圖所示）。與人類語言一樣，程式語言同樣屬於相關語言的家族。而今天，我要引出的，即其家族成員之一的 p5.js（官網）。 Introduction 簡單來講，p5.js 是一個庫配上許多工具

Apache Mahout中的機器學習演算法集【轉】

Apache Mahout 是 ApacheSoftware Foundation (ASF) 旗下的一個開源專案，提供一些可擴充套件的機器學習領域經典演算法的實現，旨在幫助開發人員更加方便快捷地建立智慧應用程式，並且，在 Mahout 的最近版本中還加入了對Apache Hadoop 的支援，使這些演

第十章圖形用戶界面入門[DDT書本學習小甲魚]【1】

代碼 str msgbox all 默認 htm 導入文件的 cbo 第十章圖形用戶界面入門[DDT書本學習小甲魚]【1】GUI 帶有按鈕文本輸入框的窗口編程Python的GUI工具包有很多，其中有個非常簡單的：EasyGui一旦你的模塊導入EasyGui,GUI

第十章圖形使用者介面入門[DDT書本學習小甲魚]【1】

第十章圖形使用者介面入門[DDT書本學習小甲魚]【1】GUI 帶有按鈕文字輸入框的視窗程式設計Python的GUI工具包有很多，其中有個非常簡單的：EasyGui一旦你的模組匯入EasyGui,GUI的操作就是一個簡單的呼叫EasyGui函式引數的問題了EasyGui官網：http://easygui

c++/visual studio常見問題【1】

LNK2001錯誤參考https://docs.microsoft.com/en-us/cpp/error-messages/tool-errors/linker-tools-error-lnk2001?view=vs-2017 無法解析的外部符號"符號"。說明程式中用到的某個符號，連結器

第六章函數[DDT書本學習小甲魚]【1】

兩種重復 alt 返回值容易 1.3 range 例如 -- 6.1Python的樂高積木程序分解為小的組成部分。三種方法實現：函數、對象、模塊6.1.1 創建和調用函數以前接觸到的BIF就是Python幫我們封裝好的函數 def 德芙關鍵字：代碼如下 def

第七章字典和集合[DDT書本學習小甲魚]【1】

mage 分享圖片 == 創建技術分享如果 height 列表 -- 7.1 字典當索引不好用時a1=["我","你","她"]a2=["我很好","你很好","她很好"]print("我要說的是：",a2[a1.index("我")]) 7.1.1 創建和訪問字典

第八章永久存儲[DDT書本學習小甲魚]【1】

小甲魚讀取末尾 module 第八章 idt rmp 當前 record 8.1 文件：因為懂你，所以永恒CPU-內存CPU-硬盤==========================================================8.1.1打開文件 o

Qt學習之路【1】：QT顯示中文問題

最近，公司專案的GUI介面使用的是Qt，研究了近兩個月的Qt發現中文顯示確實是一個問題，這個問題中主要存在兩方面的問題：【1】中文顯示；【2】中文亂碼；其中【1】問題出現的情景是：Qt的

ZooKeeper學習之配置【1】基本配置

本文開始陸續的詳細講解所有的配置選項，大部分配置項一般都有一個預設的值，很多都應該根據實際情況進行優化。因為ZooKeeper的設計很容易使用，有一些在不明白具體的配置項就開始使用，一開始工作得還好，但後續很可能會出問題。所以你需要花些時間來深入學習配置項，你會發現你將可以得到更好的效能，並能更容易的診斷問

【機器學習】機器學習常見演算法分類彙總

轉自http://www.ctocio.com/hotnews/15919.html，尊重原創機器學習無疑是當前資料分析領域的一個熱點內容。很多人在平時的工作中都或多或少會用到機器學習的演算法。這裡IT經理網為您總結一下常見的機器學習演算法，以供您在工作和學習中參

【機器學習】機器學習常見符號

機器學習常見符號符號　名稱　符號　名稱　 R 實數集 Rn n維實數向量空間　 H 希爾伯特空間 X 輸入空間 Y 輸

機器學習-常見問題積累【1】

相關推薦