1. 程式人生 > >LR演算法在申請評分卡的應用的理論

LR演算法在申請評分卡的應用的理論

本文采取的是德國公開的資料做的實驗:

一.邏輯模型的理論

由邏輯迴歸的基本原理,我們將客戶違約的概率表示為p,則正常的概率為1-p。因此,可以得到比率

 

此時,客戶違約的概率p可表示為:                                                   

評分卡設定的分值刻度可以通過將分值表示為比率對數的線性表示式來定義,即可表示為下式: 

                                                 

其中,A和B是常數。式中的負號可以使得違約概率越低,得分越高。通常情況下,這是分值的理想變動方向,即高分值代表低風險,低分值代表高風險。 
邏輯迴歸模型計算比率如下所示:                                        其中,用建模引數擬合模型可以得到模型引數β0β1βn式中的常數A、B的值可以通過將兩個已知或假設的分值帶入計算得到。通常情況下,需要設定兩個假設: 1)給某個特定的比率設定特定的預期分值; 2)確定比率翻番的分數(PDO) 

根據以上的分析,我們首先假設比率為x的特定點的分值為P。則比率為2x的點的分值應該為P+PDO。代入式中,可以得到如下兩個等式: 

即:公式推導:

                                

假設 設定評分卡刻度使得比率為{1:20}(違約正常比)時的分值為50分,PDO為10分,代入式中求得:B=14.43,A=6.78 

特別說明:在大多部分行行中基礎分值為600,比率去1:20或者是1:19,PDO一般會選用20,50,60

評分卡刻度引數A和B確定以後,就可以計算比率和違約概率,以及對應的分值了。通常將常數A稱為補償,常數B稱為刻度。 則評分卡的分值可表達為:  式中:變數x1xn是出現在最終模型中的自變數,即為入模指標。由於此時所有變數都用WOE轉換進行了轉換,可以將這些自變數中的每一個都寫(βiωij)δij的形式:  

式中ωij 為第i行第j個變數的WOE,為已知變數;βi為邏輯迴歸方程中的係數,為已知變數;δij為二元變數,表示變數i是否取第j個值。上式可重新表示為: 


此式即為最終評分卡公式。如果x1xn變數取不同行並計算其

WOE值,式中表示的標準評分卡格式,如表3.20所示: 

3.20表明,變數x1k1行,變數x2k2,以此類推;基礎分值等於(A0);由於分值分配公式中的負號,模型引數β0β1βn也應該是負值;變數xi的第j行的分值取決於以下三個數值: 


1)刻度因子B; 2)邏輯迴歸方程的引數βi 3)該行的WOE值,ωij