1. 程式人生 > >讀書筆記《推薦系統實戰》| 利用社交網路資料

讀書筆記《推薦系統實戰》| 利用社交網路資料

《推薦系統實戰》這本書的下載地址:《推薦系統實戰》

第一章 好的推薦系統 第二章 利用使用者行為資料 第三章 推薦系統冷啟動問題 第四章 利用使用者標籤資料 第五章 利用上下文資訊 美國著名的第三方調查機構尼爾森調查了影響使用者相信某個推薦結果的因素,90%的使用者相信朋友對他們的推薦。基於社交網路的推薦可以很好的模擬現實社會。所以利用社交網路資料進行推薦可以增加使用者對系統的信任度。另外利用使用者在社交網路的資料可以解決冷啟動問題。

6.1 獲取社交網路資料的途徑

主要方式:電子郵件(聯絡人);使用者的註冊資訊(居住地和工作地);使用者的位置資訊(網頁的IP和手機的GPS);論壇和討論組(豆瓣);即時聊天工具(QQ);社交網站(以Twitter為代表的興趣圖譜和以Facebook為代表的社交圖譜

)。

6.2 社交網路資料簡介

用圖定義社交網路:用圖G(V,E,w)定義一個社交網路,V表示頂點集合,表示使用者,E是邊集合,表示兩個使用者是否有關係,w表示了邊的權重。以Facebook為代表的需要雙向確認的網路,可以用無向圖表示;以Twitter為代表的社交網路只需要單方面關注,所以需要用有向圖表示。 在這裡插入圖片描述 社交網路資料:雙向確認;單向關注;基於社群的社交網路資料(同一個公司的人);

社交網路資料中的長尾分佈:使用者的出度和入度都服從長尾分佈。橫座標表示出度x,縱座標表示出度為x的使用者的數量f(x)。

6.3 基於社交網路的推薦

基於社交網路的推薦演算法:基於領域的推薦;基於圖的推薦;

資訊流推薦:每個使用者都有一個資訊牆,展示了使用者的好友最近的言論。資訊流的個性化推薦就是進一步幫助使用者從資訊牆中挑選有用的資訊。目前最流行的資訊流推薦演算法時Facebook的EdgeRank。

6.4 給使用者推薦好友

好友推薦演算法在社交網路被稱為連結預測,這裡討論比較簡單和直觀的演算法。

基於內容的匹配:常用內容屬性包括,使用者的人口統計學屬性(年齡、職業、性別等);使用者的興趣(喜歡的物品和釋出過的言論);使用者的位置資訊(使用者住址、郵編、IP等);

基於共同興趣的好友推薦:利用UserCF的思想,如果兩個使用者喜歡相同的物品(比如微博),就說明他們具有相似的興趣;此外,也可以根據使用者在社交網路中的發言提取使用者的興趣標籤,來計算使用者的興趣相似度。

基於社交網路圖的好友推薦:通過使用者u和使用者v的出度和入度,定義Wuv。根據相似度Wuv進行推薦。 在這裡插入圖片描述 在這裡插入圖片描述 在這裡插入圖片描述 這些相似度都是基於一些簡單計算公式給出的。這些相似度的計算無論時間複雜度還是空間複雜度都不是很高,非常適合線上應用使用