初探機器學習與評分卡模型

機器學習簡介

什麼是機器學習

如果一個系統能夠通過執行某個過程改變它的效能，這就是學習（什麼是學習）
不用程式設計去指定機器做什麼，而是讓機器有能力自己學習
首先定義任務T，經驗E，表現P，如果機器有一個任務T，隨著經驗E的增多，表現P也會變好，則表示機器正在經驗E中學習

三要素

模型（機器學習的成果，條件概率分佈或決策函式）
策略（計算模型的方式）
演算法

生活中的機器學習應用

垃圾郵件分類
AlphaGo圍棋AI
醫療行業
人聲識別

監督學習

學習一個模型，使模型對給定輸入做出相應的預測輸出，流程如下圖

這裡寫圖片描述

其中自變數x為自變數，是例項的特徵向量；y為因變數，是例項的結果。

監督學習主要解決分類與迴歸兩類問題

監督學習例項

已知房價，平米數的訓練集如下：

平米數	房價（萬）
50	50
80	70
100	90
130	110
150	？？？

給定一個平米數，預測該面積房價。

無監督學習

從資料中自主學習，分析資料的類別結構

評分卡介紹

什麼是評分卡（信貸場景中）

以分數的形式來衡量風險機率的一種手段
對未來一段時間內違約/逾期/失聯概率的預測
通常評分越高越安全
根據使用場景分為反欺詐評分卡、申請評分卡、行為評分卡、催收評分卡

為什麼要開發評分卡

風險控制的一個環節，根據已有資料提供逾期概率指標參考

評分卡的特性

穩定性
預測能力
等價於逾期概率

評分卡開發的常用模型

邏輯迴歸
決策樹
組合模型

基於邏輯迴歸的評分卡理論依據

一個事件發生的機率（Odds），是指該事件發生的概率與該事件不發生概率的比值。若一個客戶違約概率為p，則其正常的概率為1-p，由此可得：

Odds=p1−p
此時，客戶違約的概率p可以表示為:
p=Odds1+Odds
評分卡表示式為：
Score=A−Blog(Odds)
其中A、B為常數。由於log函式在(0→+∞)單調遞增，所以當用戶違約機率Odds越大時，Score評分越低。
通過給定
（1）某特定Odds時的Score值S

0；
（2）該特定Odds值翻倍時Score增加值PD0;
通過給定值S0與PD0帶入評分卡表示式，可求得A、B。
通過以上分析，求該使用者評分Score的問題則轉化為求使用者違約對數機率log(Odds)的問題。
依照二元邏輯迴歸構造預測函式
hθ(x)=g(θTx)=11+e−θTx
其中hθ(x)表示結果取1的概率。
推倒可得該事件的對數機率log(Odds)如下：
log(Odds)=logp1−p=loghθ(x)1−hθ(x)=log11+e−θTx1−11+e−θTx=θTx
可以發現：在邏輯斯蒂迴歸模型中，輸出Y=1的對數機率是輸入條件x的線性函式。
θTx=∑i=1nθixi=θ0+θ1x1+θ2x2+...+θnxnθ=⎡⎣⎢⎢⎢⎢θ0θ1...θn⎤⎦⎥⎥⎥⎥,x=⎡⎣⎢⎢⎢⎢x0x1...xn⎤⎦⎥⎥⎥⎥
由此可得log(Odds)=θ0+θ1x1+...+θnxn
回到信貸業務中
目標：尋找最理想的引數估計θ使得模型預測的概率相對已有樣本最準確。
方法：損失函式最小化求得θ
邏輯迴歸的損失函式為對數損失函式（具體可由極大似然估計推倒）：

初探機器學習與評分卡模型

機器學習簡介

什麼是機器學習

三要素

生活中的機器學習應用

監督學習

學習一個模型，使模型對給定輸入做出相應的預測輸出，流程如下圖

其中自變數x為自變數，是例項的特徵向量；y為因變數，是例項的結果。

監督學習主要解決分類與迴歸兩類問題

監督學習例項

無監督學習

從資料中自主學習，分析資料的類別結構

評分卡介紹

什麼是評分卡（信貸場景中）

為什麼要開發評分卡

評分卡的特性

評分卡開發的常用模型

基於邏輯迴歸的評分卡理論依據

一個事件發生的機率（Odds），是指該事件發生的概率與該事件不發生概率的比值。若一個客戶違約概率為p，則其正常的概率為1-p，由此可得：

初探機器學習與評分卡模型

網際網路金融-機器學習及評分卡構建

機器學習第二章：模型評估與選擇-總結

《機器學習》筆記---2 模型的損失函式與正則化

機器學習與深度學習系列連載：第二部分深度學習（十二）卷積神經網路 3 經典的模型（LeNet-5，AlexNet ，VGGNet，GoogLeNet，ResNet）

機器學習與深度學習系列連載：第二部分深度學習（十八) Seq2Seq 模型

機器學習與深度學習系列連載：第一部分機器學習（五）生成概率模型（Generative Model）

機器學習與深度學習系列連載：第二部分深度學習（十八) Seq2Seq 模型

王小草【機器學習】筆記--主題模型LDA實踐與應用

機器學習_生成式模型與判別式模型

淺談機器學習與深度學習的模型設計

初探機器學習之使用百度AI服務實現圖片識別與相似圖片

評分卡模型之特徵工程中的BadRate單調與特徵分箱之間的聯絡

【機器學習】【seq2seq模型與attention機制，Beam Search】

機器學習與深度學習系列連載：第一部分機器學習（四）誤差分析（Bias and Variance）和模型調優

機器學習與深度學習系列連載：第一部分機器學習（十八）模型評估

寫給程式設計師的機器學習入門 (三) - 線性模型，啟用函式與多層線性模型

軟件——機器學習與Python，聚類，K——means

機器學習與量化交易-2-3

大數據、機器學習與信息安全

初探機器學習與評分卡模型

機器學習簡介

什麼是機器學習

三要素

生活中的機器學習應用

監督學習

學習一個模型，使模型對給定輸入做出相應的預測輸出，流程如下圖

其中自變數x為自變數，是例項的特徵向量；y為因變數，是例項的結果。

監督學習主要解決分類與迴歸兩類問題

監督學習例項

無監督學習

從資料中自主學習，分析資料的類別結構

評分卡介紹

什麼是評分卡（信貸場景中）

為什麼要開發評分卡

評分卡的特性

評分卡開發的常用模型

基於邏輯迴歸的評分卡理論依據

一個事件發生的機率（Odds），是指該事件發生的概率與該事件不發生概率的比值。若一個客戶違約概率為p，則其正常的概率為1-p，由此可得：

相關推薦