什麼是好的推薦系統

推薦系統和搜尋引擎對於使用者來說是兩個互補的工具。搜尋引擎滿足了使用者有明確目的時的主動查詢需求，而推薦系統能夠在使用者沒有明確目的的時候幫助他們發現感興趣的新內容。
推薦系統是為了解決資訊過載而推出的
推薦系統的任務就是聯絡使用者和資訊，一方面幫助使用者發現對自己有價值的資訊，另一方面讓資訊能夠展現在對它感興趣的使用者面前，從而實現資訊消費者和資訊生產者的雙贏
主流商品往往代表了絕大多數使用者的需求，而長尾商品往往代表了一小部分使用者的個性化需求。因此，如果要通過發掘長尾提高銷售額，就必須充分研究使用者的興趣，而這正是個性化推薦系統主要解決的問題。
推薦系統通過發掘使用者的行為，找到使用者的個性化需求，從而將長尾商品準確地推薦給需要它的使用者，幫助使用者發現那些他們感興趣但很難發現的商品。
推薦系統包括社會化推薦（social recommendation），即讓好友給自己推薦物品。基於內容的推薦（content-based filtering），。這種方式稱為基於協同過濾（collaborative filtering）的推薦。
推薦演算法的本質是通過一定的方式將使用者和物品聯絡起來
首先，推薦系統需要滿足使用者的需求；其次，推薦系統要讓各出版社的書都能夠被推薦給對其感興趣的使用者；好的推薦系統設計，能夠讓推薦系統本身收集到高質量的使用者反饋，不斷完善推薦的質量，增加使用者和網站的互動，提高網站的收入
好的推薦系統不僅僅能夠準確預測使用者的行為，而且能夠擴充套件使用者的視野，幫助使用者發現那些他們可能會感興趣，但卻不那麼容易發現的東西。同時，推薦系統還要能夠幫助商家將那些被埋沒在長尾中的好商品介紹給可能會對它們感興趣的使用者
好的推薦系統不僅僅能夠準確預測使用者的行為，而且能夠擴充套件使用者的視野，幫助使用者發現那些他們可能會感興趣，但卻不那麼容易發現的東西。同時，推薦系統還要能夠幫助商家將那些被埋沒在長尾中的好商品介紹給可能會對它們感興趣的使用者
推薦系統的評測指標包括包括準確度、覆蓋度、新穎度、驚喜度、信任度、透明度等。
在推薦系統中，主要有3種評測推薦效果的實驗方法，即離線實驗（offline experiment）、使用者調查（user study）和線上實驗（online experiment）

UserCF與ItemCF

UserCF
ItemCF
K是影響準確率的重要因素
UserCF的使用不及ItemCF流行
K越大，兩者的覆蓋率均降低
K越大，UserCF流行度降低而ItemCF則不一定
UserCF的推薦更社會化，反映了使用者所在的小型興趣群體中物品的熱門程度，而ItemCF的推薦更加個性化，反映了使用者自己的興趣傳承。
UserCF比較適合個性化新聞推薦，UserCF可以給使用者推薦和他有相似愛好的一群其他使用者今天都在看的新聞，這樣在抓住熱點和時效性的同時，保證了一定程度的個性化。
從技術上考慮，UserCF需要維護一個使用者相似度的矩陣，而ItemCF需要維護一個物品相似度矩陣。從儲存的角度說，如果使用者很多，那麼維護使用者興趣相似度矩陣需要很大的空間，同理，如果物品很多，那麼維護物品相似度矩陣代價較大。

LFM隱語義模型

在LFM中，重要的引數有4個：  隱特徵的個數F；  學習速率alpha；  正則化引數lambda；  負樣本/正樣本比例 ratio。通過實驗發現，ratio引數對LFM的效能影響最大
使用者相關表，則需要O(M*M)的空間，而對於物品相關表，則需要O(N*N)的空間。而LFM在建模過程中，如果是F個隱類，那麼它需要的儲存空間是O(F*(M+N))，這在 M和N很大時可以很好地節省離線計算的記憶體
在一般情況下，LFM的時間複雜度要稍微高於UserCF和ItemCF，這主要是因為該演算法需要多次迭代。但總體上，這兩種演算法在時間複雜度上沒有質的差別。
LFM不能進行線上實時推薦，ItemCF演算法支援很好的推薦解釋，它可以利用使用者的歷史行為解釋推薦結果。但LFM無法提供這樣的解釋，它計算出的隱類雖然在語義上確實代表了一類興趣和物品，卻很難用自然語言描述並生成解釋展現給使用者

冷啟動問題

如何在沒有大量使用者資料的情況下設計個性化推薦系統並且讓使用者對推薦結果滿意從而願意使用推薦系統，就是冷啟動的問題。
冷啟動問題（cold start）主要分3類：
（1）使用者冷啟動使用者冷啟動主要解決如何給新使用者做個性化推薦的問題。當新使用者到來時，我們沒有他的行為資料，所以也無法根據他的歷史行為預測其興趣，從而無法藉此給他做個性化推薦。
（2）物品冷啟動物品冷啟動主要解決如何將新的物品推薦給可能對它感興趣的使用者這一問題。
（3）系統冷啟動系統冷啟動主要解決如何在一個新開發的網站上（還沒有使用者，也沒有用戶行為，只有一些物品的資訊）設計個性化推薦系統，從而在網站剛釋出時就讓使用者體驗到個性化推薦服務這一問題。
對於這3種不同的冷啟動問題，有不同的解決方案。一般來說，可以參考如下解決方案：
（1）提供非個性化的推薦非個性化推薦的最簡單例子就是熱門排行榜，我們可以給使用者推薦熱門排行榜，然後等到使用者資料收集到一定的時候，再切換為個性化推薦。
（2）利用使用者註冊時提供的年齡、性別等資料做粗粒度的個性化。  利用使用者的社交網路賬號登入（需要使用者授權），匯入使用者在社交網站上的好友資訊，然後給使用者推薦其好友喜歡的物品。
（3）要求使用者在登入時對一些物品進行反饋，收集使用者對這些物品的興趣資訊，然後給使用者推薦那些和這些物品相似的物品。一般情況下，這些物品的特點是：a、比較熱門 b、具有代表性和區分性才c、啟動物品集合需要有多樣性。（其中Nadav Golbandi的演算法首先會從所有使用者中找到具有最高區分度的物品i，然後將使用者分成3 類。然後在每類使用者中再找到最具區分度的物品，然後將每一類使用者又各自分為3類，也就是將總使用者分成9類，然後這樣繼續下去，最終可以通過對一系列物品的看法將使用者進行分類。而在冷啟動時，我們從根節點開始詢問使用者對該節點物品的看法，然後根據使用者的選擇將使用者放到不同的分枝，直到進入最後的葉子節點，此時我們就已經對使用者的興趣有了比較清楚的瞭解，從而可以開始對使用者進行比較準確地個性化推薦。）
（4）對於新加入的物品，可以利用內容資訊，將它們推薦給喜歡過和它們相似的物品的使用者。 UserCF算法對物品冷啟動問題並不非常敏感。當一個新物品加入時，總會有使用者從某些途徑看到這些物品，對這些物品產生反饋。那麼，當一個使用者對某個物品產生反饋後，和他歷史興趣相似的其他使用者的推薦列表中就有可能出現這一物品，從而更多的人就會對這個物品產生反饋，解決第一推動力最簡單的方法是將新的物品隨機展示給使用者，但這樣顯然不太個性化，因此可以考慮利用物品的內容資訊，將新物品先投放給曾經喜歡過和它內容相似的其他物品的使用者；對於ItemCF演算法來說，物品冷啟動就是一個嚴重的問題了。因為ItemCF演算法的原理是給使用者推薦和他之前喜歡的物品相似的物品。ItemCF演算法會每隔一段時間利用使用者行為計算物品相似度表（一般一天計算一次），線上服務時ItemCF演算法會將之前計算好的物品相關度矩陣放在記憶體中。因此，當新物品加入時，記憶體中的物品相關表中不會存在這個物品，從而ItemCF演算法無法推薦新的物品。解決這一問題的辦法是頻繁更新物品相似度表，但基於使用者行為計算物品相似度是非常耗時的事情，主要原因是使用者行為日誌非常龐大。而且，新物品如果不展示給使用者，使用者就無法對它產生行為，通過行為日誌計算是計算不出包含新物品的相關矩陣的。為此，我們只能利用物品的內容資訊計算物品相關表，並且頻繁地更新相關表（比如半小時計算一次）。
（5）在系統冷啟動時，可以引入專家的知識，通過一定的高效方式迅速建立起物品的相關度表。

使用者標籤資料

根據給物品打標籤的人的不同，標籤應用一般分為兩種：一種是讓作者或者專家給物品打標籤；另一種是讓普通使用者給物品打標籤
標籤系統中的推薦問題主要有以下兩個：
（1）如何利用使用者打標籤的行為為其推薦物品（基於標籤的推薦）
（2）如何在使用者給物品打標籤時為其推薦適合該物品的標籤（標籤推薦）
基於標籤的推薦：
標籤稀疏性的問題，存在標籤過少影響推薦的情況。可以加入與已有標籤類似的標籤，標籤相似度的度量方法：
標籤的推薦：
第0種方法就是給使用者u推薦整個系統裡最熱門的標籤；
第1種方法就是給使用者u推薦物品i上最熱門的標籤；
第2種方法是給使用者u推薦他自己經常使用的標籤；
第3種演算法是前面兩種的融合；

【推薦系統實戰】：C++實現基於用戶的協同過濾（UserCollaborativeFilter）

color style popu ted std 相似度 abi ear result 好早的時候就打算寫這篇文章，可是還是參加阿裏大數據競賽的第一季三月份的時候實驗就完畢了。硬生生是拖到了十一假期。自己也是醉了。。。找工作不是非常順利，希望寫點東西回想一下知識。然後再

下載基於大數據技術推薦系統實戰教程(Spark ML Spark Streaming Kafka Hadoop Mahout Flume Sqoop Redis)

大數據技術推薦系統推薦系統實戰地址:http://pan.baidu.com/s/1c2tOtwc 密碼:yn2r82課高清完整版，轉一播放碼。互聯網行業是大數據應用最前沿的陣地，目前主流的大數據技術，包括 hadoop，spark等，全部來自於一線互聯網公司。從應用角度講，大數據在互聯網領域主

《推薦系統實戰》第一章好的推薦系統

1.1 什麼是推薦系統個性化推薦系統：一個自動化的工具，它可以分析你的歷史興趣，從龐大的資訊中找到符合你興趣的物品供你選擇。充分研究使用者的興趣正是個性化推薦系統主要解決的問題。推薦系統通過發掘使用者的行為，找到使用者的個性化需求，從而將長尾商品準確地推薦給需要它的使用者，幫助使用者發現

電商大資料專案-推薦系統實戰之推薦演算法

(1)電商大資料專案-推薦系統實戰http://blog.51cto.com/6989066/2325073 （七）推薦系統常用演算法協同過濾演算法協同過濾演算法（Collaborative Filtering：CF）是很常用的一種演算法，在很多電商網站上都有用到。CF演算法包括基於使用者的CF（User-

電商大資料專案（二）-推薦系統實戰之實時分析以及離線分析

電商大資料專案-推薦系統實戰（一）環境搭建以及日誌，人口，商品分析http://blog.51cto.com/6989066/2325073電商大資料專案-推薦系統實戰之推薦演算法http://blog.51cto.com/6989066/2326209電商大資料專案-推薦系統實戰之實時分析以及離線分析htt

讀書筆記《推薦系統實戰》| 推薦系統冷啟動問題

本人將《推薦系統實戰》放在了資源裡，如有需要請前往下載。 3.1 冷啟動問題簡介冷啟動問題的解決方案：提供非個性化的推薦。為新註冊使用者推薦熱門的商品，等使用者資料蒐集到一定程度後，切換到個性化推薦；利用使用者註冊時提供的年齡性別等資料做粗粒度的個性

讀書筆記《推薦系統實戰》| 利用社交網路資料

《推薦系統實戰》這本書的下載地址：《推薦系統實戰》第一章好的推薦系統第二章利用使用者行為資料第三章推薦系統冷啟動問題第四章利用使用者標籤資料第五章利用上下文資訊美國著名的第三方調查

項亮《推薦系統實戰》思維導圖

最近拜讀了項亮博士的《推薦系統實戰》，收穫很大，整理了一系列的部落格。將各章節的連結放在下面，歡迎檢視、交流。本文主要總結了1-6章的主要思路，並思維導圖繪製。《推薦系統實戰》、《集體智慧程式設計》、思維導圖第一章好的推薦系統第二章利用使用者行為資料第三章推薦系統冷

ALS推薦系統實戰

拿到某超市的銷售資料，將資料整理後得到一年三千萬條交易記錄，想試試用spark中的推薦系統做一下預測先把資料匯入到HDFS中，資料需要使用者id，商品id，和購買次數，這裡我拿購買次數當作電影推薦系統中的電影評分 HDFS中的資料用":"分割開。如下： 461365:22

《推薦系統實戰》——基於物品的協同過濾實現

一：物品相似度計算&推薦原始碼（演算法參考項亮《推薦系統實戰》P55）：其他程式碼模組參考我的另外一篇部落格：這裡寫連結內容 def ItemSimilarity(self, train=None): train = se

[大資料專案]-0011-基於大資料技術推薦系統演算法案例實戰視訊教

2018最新最全大資料技術、專案視訊。整套視訊，非那種淘寶雜七雜八網上能免費找到拼湊的亂八七糟的幾年前的不成體系浪費咱們寶貴時間的垃圾，詳細內容如下，視訊高清不加密，需要的聯絡QQ：3164282908（加Q註明51CTO）。 [大資料專案]-0010-基於大資料技術

【備忘】基於Hadoop，Spark大資料技術的推薦系統演算法實戰教程

課程簡介： 2017年最新大資料推薦系統演算法實戰視訊教程，共18.1G容量。附講義、程式碼與練習資料,配套齊全,高清不加密。課程介紹：網際網路行業是大資料應用最前沿的陣地，目前主流的大資料技術，包括 ha

實戰智慧推薦系統（14）-- 推薦系統架構

外圍架構一般來說，每個網站都有一個 UI 系統，UI 系統負責給使用者展示網頁並和使用者互動。網站會通過日誌系統將使用者在 UI 上的各種各樣的行為記錄到使用者行為日誌中。從上面的結構可以看到，除了推薦系統本身，主要還依賴兩個條件--介面展示和使用者行為資料。推薦系統架構推薦

實戰智慧推薦系統（4）-- 什麼是好的推薦系統？

推薦系統與搜尋引擎要回答什麼是好的推薦系統，我覺得首先得知道為什麼需要推薦系統。推薦系統的存在價值必須建立在兩個必要的前提：（1）資訊過載。隨著資訊科技和網際網路的發展，人們逐漸從資訊匱乏走向了資訊過載時代。比如說如果在小超市買個東西，一件一件挑就是了。但是在淘寶網買東西，假

推薦系統實戰

什麼是好的推薦系統

UserCF與ItemCF

LFM隱語義模型

冷啟動問題

使用者標籤資料

【推薦系統實戰】：C++實現基於用戶的協同過濾（UserCollaborativeFilter）

下載基於大數據技術推薦系統實戰教程(Spark ML Spark Streaming Kafka Hadoop Mahout Flume Sqoop Redis)

推薦系統實戰——冷啟動問題

《推薦系統實戰》第一章好的推薦系統

電商大資料專案-推薦系統實戰之推薦演算法

電商大資料專案（二）-推薦系統實戰之實時分析以及離線分析

讀書筆記《推薦系統實戰》| 推薦系統冷啟動問題

讀書筆記《推薦系統實戰》| 利用社交網路資料

推薦系統實戰(一)

項亮《推薦系統實戰》思維導圖

推薦系統實戰

ALS推薦系統實戰

《推薦系統實戰》——基於物品的協同過濾實現

[大資料專案]-0011-基於大資料技術推薦系統演算法案例實戰視訊教

推薦系統遇上深度學習(十)--GBDT+LR融合方案實戰

推薦系統遇上深度學習(十)--GBDT+LR融合方案實戰--解決特徵組合問題

【備忘】基於Hadoop，Spark大資料技術的推薦系統演算法實戰教程

推薦系統遇上深度學習(二十)--貝葉斯個性化排序(BPR)演算法原理及實戰

實戰智慧推薦系統（14）-- 推薦系統架構

實戰智慧推薦系統（4）-- 什麼是好的推薦系統？

推薦系統實戰

什麼是好的推薦系統

UserCF與ItemCF

LFM隱語義模型

冷啟動問題

使用者標籤資料

相關推薦