Neo4j 做推薦（11）—— 協同過濾（皮爾遜相似性）

阿新 • • 發佈：2018-11-16

皮爾遜相似性或皮爾遜相關性是我們可以使用的另一種相似度量。這特別適合產品推薦，因為它考慮到不同使用者將具有不同的平均評分這一事實：平均而言，一些使用者傾向於給出比其他使用者更高的評分。由於皮爾遜相似性考慮了均值的差異，因此該指標將解釋這些差異。

根據皮爾遜的相似度，找到與Cynthia Freeman最相似的使用者

MATCH (u1:User {name:"Cynthia Freeman"})-[r:RATED]->(m:Movie)
WITH u1, avg(r.rating) AS u1_mean

MATCH (u1)-[r1:RATED]->(m:Movie)<-[r2:RATED]-(u2)
WITH u1, u1_mean, u2, COLLECT({r1: r1, r2: r2}) AS ratings WHERE size(ratings) > 10

MATCH (u2)-[r:RATED]->(m:Movie)
WITH u1, u1_mean, u2, avg(r.rating) AS u2_mean, ratings

UNWIND ratings AS r

WITH sum( (r.r1.rating-u1_mean) * (r.r2.rating-u2_mean) ) AS nom,
     sqrt( sum( (r.r1.rating - u1_mean)^2) * sum( (r.r2.rating - u2_mean) ^2)) AS denom,
     u1, u2 WHERE denom <> 0

RETURN u1.name, u2.name, nom/denom AS pearson
ORDER BY pearson DESC LIMIT 100

Neo4j 做推薦（11）—— 協同過濾（皮爾遜相似性）

皮爾遜相似性或皮爾遜相關性是我們可以使用的另一種相似度量。這特別適合產品推薦，因為它考慮到不同使用者將具有不同的平均評分這一事實：平均而言，一些使用者傾向於給出比其他使用者更高的評分。由於皮爾遜相似性考慮了均值的差異，因此該指標將解釋這些差異。根據皮爾遜的相似度，找到與Cynthia

Neo4j 做推薦（12）—— 協同過濾（基於鄰域的推薦）

kNN——K近鄰現在我們有了一種基於偏好查詢類似使用者的方法，下一步是允許每個k個最相似的使用者投票選擇應該推薦的專案。主要有：

Neo4j 做推薦（10）—— 協同過濾（餘弦相似度）

餘弦距離： Jaacard相似度對於比較電影很有用，實際上是比較兩組（型別、演員、導演等）。但是對於電影評級，每個關係都有一個我們可以考慮的權重。餘弦相似度：兩個使用者的餘弦相似度將告訴我們兩個使用者對電影的偏好有多相似。具有高餘弦相似度的使用者將具有類似的偏好。根據

Neo4j 做推薦（9）—— 協同過濾（人群的智慧）

簡單的協同過濾 MATCH (u:User {name: "Cynthia Freeman"})-[:RATED]->(:Movie)<-[:RATED]-(o:User) MATCH (o)-[:RATED]->(rec:Movie) WHERE NOT EXISTS(

Neo4j 做推薦（8）—— 協同過濾（利用電影評級）

協同過濾：使用網路中其他使用者的首選項，評級和操作來查詢要推薦的專案。（買這個東西的使用者，還買了那個東西）使用者Misty Williams的所有評分 // Show all ratings by Misty Williams MATCH (u:User

機器學習基礎（三十四）—— 協同過濾（之獲得推薦）

為未被某人評分的電影的進行打分，我們當然可以查詢品味與此人最為接近（依據相似性度量）的人的相應評分，但是這樣做過於簡單和隨意（permissive）。這種做法的問題在於：我們會找到一個熱衷某部電影的古怪評論者，而根據 topMatch 的結果，所有其他的評論者都

機器學習基礎（三十五）—— 協同過濾（從匹配使用者到匹配商品）

考慮如下的使用者對影片的打分，由巢狀字典定義： critics = {'Lisa Rose': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.5, 'J

Neo4j 做推薦（3）—— 協同過濾

協同過濾簡單來說是利用某興趣相投、擁有共同經驗之群體的喜好來推薦使用者感興趣的資訊 MATCH (m:Movie {title: "Crimson Tide"})<-[:RATED]-(u:User)-[:RATED]->(rec:Movie) RETURN rec.title

Neo4j 做推薦（4）—— 基於內容的過濾（續）

Neo4j 做推薦（2）—— 基於內容的過濾前文只是簡單描述了內容過濾的概念和簡單演示。在此，我們將從具體例項來介紹如何使用基於內容的過濾方法來給使用者推薦電影。首先，基於共同型別的相似性，如果使用者看過《Inception》，我們就可以給使用者推薦

Neo4j 做推薦（2）—— 基於內容的過濾

基於內容的過濾(Content-based filtering)：該技術通過比較商品之間的相似性或者相關性進行推薦。這種方式忽略使用者的購買行為，只考慮商品之間的相似關係。 MATCH p=(m:Movie {title: "Net, The"})-[:ACTED_IN|:IN_GENRE|

【推薦系統實戰】：C++實現基於用戶的協同過濾（UserCollaborativeFilter）

color style popu ted std 相似度 abi ear result 好早的時候就打算寫這篇文章，可是還是參加阿裏大數據競賽的第一季三月份的時候實驗就完畢了。硬生生是拖到了十一假期。自己也是醉了。。。找工作不是非常順利，希望寫點東西回想一下知識。然後再

Neo4j 做推薦（7）—— 基於內容的相似度量標準

相似度量是用於生成個性化推薦的重要組件，這些推薦允許我們量化兩個項目的相似程度（或者我們稍後會看到，兩個用戶偏好的相似程度）。 Jaccard指數是0到1之間的數字，表示兩組的相似程度。兩個相同集合的Jaccard指數是1. 如果兩個集合沒有公共元素，則Jaccard

Neo4j 做推薦（6）—— 加權內容演算法

除了考慮計算相似性的型別之外，還有更多的特徵，如演員和導演。讓我們使用加權總和根據他們共同的演員、流派和導演的數量對建議進行評分，以提高分數。根據重疊特徵的數量和型別計算加權和： // Find similar movies by common genres MATCH (m:Movie)

Neo4j 做推薦（5）—— 基於型別的個性化建議

如果我們知道使用者看過了哪些電影，我們可以使用此資訊來推薦類似的電影： // Content recommendation by overlapping genres MATCH (u:User {name: "Angelica Rodriguez"})-[r:RATED]->(m:M

Neo4j 做推薦（1）—— 基礎資料

Neo4j 提供了sandbox，開始可以使用3天，到期後可以續7天。只需要註冊一個賬號即可。登入後，點選Sandbox，可以建立電影推薦相關的，當然也可以自己選擇其他的。建立好後會收到郵件，也可以網頁上檢視詳細：點選連結進去，可以看到所有的資料都建立好

基於使用者的協同過濾（user-based CF）推薦系統【2】

這一篇是緊跟著上一篇基於使用者的協同過濾（user-based CF）推薦系統【1】的，這一篇只是把計算相似度的方法換成了餘弦相似度，當然最後計算評分的公式也就變了。下面只把有變化的那部分程式碼貼出來。

Machine Learning第九講【推薦系統】-- （二）協同過濾

一、Collaborative Filtering（協同過濾）協同過濾能夠自行學習所需要使用的特徵。來看下面的例子：在之前講的基於內容的推薦系統中，我們需要事先建立特徵並知道特徵值，這是比較困難的。假設我們某一使用者的喜好，即假如Alice、Bob喜歡romance的電影，carol

Neo4j 做推薦（11）—— 協同過濾（皮爾遜相似性）

Neo4j 做推薦（11）—— 協同過濾（皮爾遜相似性）

Neo4j 做推薦（12）—— 協同過濾（基於鄰域的推薦）

Neo4j 做推薦（10）—— 協同過濾（餘弦相似度）

Neo4j 做推薦（9）—— 協同過濾（人群的智慧）

Neo4j 做推薦（8）—— 協同過濾（利用電影評級）

機器學習基礎（三十四）—— 協同過濾（之獲得推薦）

機器學習基礎（三十五）—— 協同過濾（從匹配使用者到匹配商品）

Neo4j 做推薦（3）—— 協同過濾

Neo4j 做推薦（4）—— 基於內容的過濾（續）

Neo4j 做推薦（2）—— 基於內容的過濾

【推薦系統實戰】：C++實現基於用戶的協同過濾（UserCollaborativeFilter）

Neo4j 做推薦（7）—— 基於內容的相似度量標準

Neo4j 做推薦（6）—— 加權內容演算法

Neo4j 做推薦（5）—— 基於型別的個性化建議

Neo4j 做推薦（1）—— 基礎資料

推薦系統學習（一）——協同過濾

基於使用者的協同過濾（user-based CF）推薦系統【2】

Machine Learning第九講【推薦系統】-- （二）協同過濾

推薦之協同過濾（思路簡單梳理）

推薦系統之協同過濾（CF）演算法

Neo4j 做推薦 （11）—— 協同過濾（皮爾遜相似性）

相關推薦

Neo4j 做推薦（11）—— 協同過濾（皮爾遜相似性）