點選率預估演算法:FM與FFM
阿新 • • 發佈:2019-01-22
點選率預估演算法:FFM
@(計算廣告)[計算廣告]
1、FM
1.1 背景
1.1.1 線性模型
常見的線性模型,比如線性迴歸、邏輯迴歸等,它只考慮了每個特徵對結果的單獨影響,而沒有考慮特徵間的組合對結果的影響。
對於一個有n維特徵的模型,線性迴歸的形式如下:
其中
從(1)式可以看出來,模型的最終計算結果是各個特徵的獨立計算結果,並沒有考慮特徵之間的相互關係。
舉個例子,我們“USA”與”Thanksgiving”,”China”與“Chinese new year”這樣的組合特徵是很有意義的,在這樣的組合特徵下,會對某些商品表現出更強的購買意願,而單獨考慮國家及節日都是沒有意義的。
1.1.2 二項式模型
我們在(1)式的基礎上,考慮任意2個特徵分量之間的關係,得出以下模型:
這個模型考慮了任意2個特徵分量之間的關係,但並未考慮更高階的關係。
模型涉及的引數數量為:
對於引數
但對於引數
在資料稀疏的實際應用場景中,二次項 i
1.2 FM
1.2.1 FM基本原理
為了解決上述由於資料稀疏引起的訓練不足的問題,我們為每個特徵維度
其中k為輔助變數的維度,依經驗而定,一般而言,對於特徵維度足夠多的樣本,k<
1.2.2 資料分析
我們的目標是要求得以下互動矩陣W: