用Python寫個簡單的推薦系統（一）

阿新 • • 發佈：2019-01-07

本篇建立在電影評分的環境下，對多位成員通過各自電影評分的情況，利用兩種相似度測量（歐幾里得距離和皮爾遜相關度）檢視使用者之間的相似度。

Python version3.4

1. 建立影評評分字典

電影種類6種：a,b,c,d,e,f使用者7人： Cathy, Sophie, Susie, Antonio,Marco,Jack, Leo

critics={'Cathy':{'a':2.5,'b':3.5,'c':3,'d':3.5,'e':2.5,'f':3},

'Sophie':{'a':3,'b':3.5,'c':1.5,'d':5,'e':1.5,'f':3},

'Susie':{'a':2.5,'b':3,'d':3.5,'f':4},

'Antonio':{b':3.5,'c':3,'d':4,'e':2.5,'f':4.5},

'Marco':{'a':3,'b':4,'c':2,'d':3,'e':2,'f':3},

'Jack':{'a':3,'b':4,'d':5,'e':3.5,'f':3}

'Leo':{'b':4.5,'d':4,'e':1.0}}

先儲存該檔案為recommendations.py，推薦系統的資料集構造成。

2. 關於歐幾里得距離和計算

歐幾里得度量定義歐幾里得空間中，點x =(x₁,...,x_n)和 y =(y₁,...,y_n)之間的距離為

（以上來自維基百科官方定義。其實歐幾里得距離就類似在一個一維座標系中兩個點的距離。其中水平軸上一種item，垂直軸上一個item。

3. 在python直譯器中秋歐幾里得距離例子：

>>>from math import sqrt

>>>sqrt (pow(4.5-4, 2) + pow (1-2,2))

4. 計算相似度（歐幾里得）

from math import sqrt

#返回一個有關person1與person2的基於距離的相似度評價
def sim_distance(prefs,person1,person2):
    #得到shared_items的列表
    si={}
    for item in prefs[person1]:
        if item in prefs[person2]:
            si[item]=1
     #如果兩者沒有共同之處，則返回0
    if len(si)==0: return 0

    #計算所有差值的平方和
    sum_of_squares= sum([pow(prefs[person1][item]-prefs[person2][item],2)
                         for item in prefs[person1] if item in prefs[person2]])
    return 1/(1+sqrt(sum_of_squares))

5. 呼叫該函式，分別傳入兩個人的名字，並計算出相似度的評價值

>>>import recommendations

>>>recommendations.sim_distance(recommendations.critics,’Cathy’,’Sophie’)

0.29429805508554946

注意：python3中已經移去reload模組，建立的recommendations模組做過任何修改，儲存直接用即可。

皮爾遜相關係數評估相似度

6. 關於皮爾遜相關係數

兩個變數之間的皮爾遜相關係數定義為兩個變數之間的協方差和標準差的商：

以上方程定義了總體相關係數, 一般表示成希臘字母ρ(rho)。基於樣本對協方差和標準差進行估計，可以得到樣本相關係數, 一般表示成r：

對於有些使用者會給評分的電影普遍打高分，而有些使用者普遍打的分低，用皮爾遜相關係數就可以更好的體現相似度，一樣可以體現出兩種高低趨勢下對同種電影的相似偏好。

7. 用皮爾遜相關度定義函式

#返回p1和p2的皮爾遜相關係數
def sim_pearson (prefs,person1,person2):
    si={}
    for item in prefs[person1]:
         if item in prefs[person2]: si[item]=1
    n=len(si)

    if n==0:return 1

    sum1=sum([prefs[person1][it] for it in si])
    sum2=sum([prefs[person2][it] for it in si])

    sum1Sq=sum([pow(prefs[person1][it],2)for it in si])
    sum2Sq=sum([pow(prefs[person2][it],2)for it in si])

    pSum=sum([prefs[person1][it]*prefs[person2][it] for it in si])
 #calculate the pearsonvlaue
    num=pSum-(sum1*sum2/n)
    den=sqrt((sum1Sq-pow(sum1,2)/n)*(sum2Sq-pow(sum2,2)/n))
    if den==0: return 0
    r=num/den
    return r

為區別歐幾里得距離的py檔案，皮爾遜的另存為recommendations1.py

8. 用皮爾遜相關係數的recommendations1 模組求相關評價值

>>> import recommendations1

>>> print (sim_pearson(critics, ‘Cathy’,’Sophie’)

0.39605901719066977

9. 相似度排名列表

上述的方法只能先計算出任兩個人之間的相似度，下面我們就來找和自己有相似品味的影評者。將該函式加入上面皮爾遜方法的recommendations1.py中，得到一個人員的有序列表。

def topmatches (prefs,person,n,similarity=sim_pearson):
    scores=[(similarity(prefs,person,other),other)
                for other in prefs if other!=person]
    scores.sort()#sort the similarity 
    scores.reverse()
    return scores[0:n]

10. 得到有關影評者相似度評價值的列表

>>>import recommendations1

>>>recommendation1s.topmatches(critics,’Leo’,5)

得到結果(皮爾遜相關度):

[(1.0, 'Marco'),(0.9912407071619299, 'Cathy'), (0.66284898035987, 'Jack'),(0.38124642583151164, 'Sophie'), (0, 'Antonio')]

如果在之前的歐幾里得距離的recommendations.py中得到人員的有序列表，則：

def topmatches (prefs,person,n,similarity=sim_distance):
    scores=[(similarity(prefs,person,other),other)
                for other in prefs if other!=person]
    scores.sort()#sort the similarity 
    scores.reverse()
    return scores[0:n]

>>>import recommendations

>>>recommendations.topmatches(critics,’Leo’,5)

得到結果:

[(0.5, 'Antonio'),(0.4721359549995794, 'Marco'), (0.38742588672279304, 'Susie'), (0.3483314773547883, 'Cathy'), (0.2674788903885893, 'Jack')]

用python做個彈球遊戲（一）

用python tkinter模組做一個擊打反彈球和球拍的遊戲。球在螢幕上飛，玩家需要把它擊打回去，只要球落到螢幕底部，遊戲就結束。首先我們做一個在螢幕上到處移動的小球： #coding:utf-8 from tkinter import * import ra

用Python寫個簡單的推薦系統（一）

本篇建立在電影評分的環境下，對多位成員通過各自電影評分的情況，利用兩種相似度測量（歐幾里得距離和皮爾遜相關度）檢視使用者之間的相似度。 Python version3.4 1. 建立影評評分字典電影種類6種：a,b,c,d,e,f使用者7人： C

使用Mahout實現推薦系統（一）：MySQL資料來源的簡單推薦

最近在做推薦系統，以前從沒接觸過，通過查閱，瞭解到一些推薦系統相關的開源框架，對比了下，使用Java開發的Mahout比較適合，通過學習，簡單實現了一些功能，通過這篇文章記錄一下，後續學習到進一步用法還會更新這個系列。使用mysql作為資料來源，新建一張

基於Spark MLlib平臺和基於模型的協同過濾演算法的電影推薦系統（一）協同過濾演算法概述&&基於模型的協同過濾的演算法思想（演算法模型和結構待補充）

本文暫時分為三部分：（一）基於Spark MLlib平臺和基於模型的協同過濾演算法的電影推薦系統（一） → 協同過濾演算法概述&&基於模型的協同過濾的演算法思想（二）基於Spark MLlib平臺和基於模型的協同過濾演算法的電影推薦

用Python實現古詩詞填字遊戲（一）

## Created by PosPro ## http://blog.csdn.net/pospro import re i=3200 # PosPro says:在測試時無需讀取全部資訊，可以通過此引數調整讀入行數，加快測試 INDEXNUM=0 EMPTYLINE=0 STATEFLAG=0 d

知識圖譜+推薦系統（一）

知識圖譜作為認知智慧的重要一環，知識賦能的智慧推薦將成為未來推薦的主流。智慧推薦表現在多個方面，包括場景化推薦、任務型推薦、冷啟動場景下推薦、跨領域推薦、知識型推薦[1] 1）場景化推薦比如使用者在淘寶上搜“沙灘褲”、“沙灘鞋”，可以推測這個使用者很有可能要去沙灘度假。那麼平臺是否能推薦“泳衣”、“防晒霜”

用python寫一個簡單的推薦系統

前言在上篇文章豆瓣電影，電視劇DM實戰中提及到，我和室友們產生了劇荒，萌生出要做一個個人用的推薦系統，解決劇荒的問題，經過一輪的死纏爛打，這個個人推薦系統終於成型了。今天來分享一下心得，對此感興趣的朋友可以自己對著寫一個。傳統推薦系統演算法首先介紹一下傳統

用python寫一個簡單的excel表格獲取當時的linux系統信息

psutil 生成之前建立 set ces ext 流量關閉最近在學習excel表格的制作，順便結合之前學習的內容，利用python的兩個模板，分別是獲取系統信息的psutil，和生成excel表格的xlsxwriter。利用這兩個模板將生成一個簡單的excel表格

用python做推薦系統（二）

一、簡介繼上一篇基於使用者的推薦演算法，這一篇是要基於商品的，基於使用者的好處是可以根據使用者的評價記錄找出跟他興趣相似的使用者，再推薦這些使用者也喜歡的電影，但是萬一這個使用者是新使用者呢？或是他還沒有對任何電影做評價，那我們要怎麼去推薦他可能會有興趣的東西呢？這邊就是要介紹基於商品的相似度，我們開啟豆

用python寫個隨機驗證碼

range emp pytho [] and random code port rand 隨機驗證碼 import random li = [] for i in range(8): r = random.randrange(0,5) print(r)

女朋友是機票販子？用Python寫個刷飛機票的指令碼！生活費多了兩百

進群：548377875 即可獲取數十套PDF從零基礎到專案實戰的哦！看到上面的介面你是否也有下面的感受：簡單描述一下eterm的操作流程，方便理解指令碼的

用node寫個簡單的靜態服務器

exist text 本地控制 erro binary node quest png 直接上代碼吧，我把它命名為 app.js, 只要在該文件所在目錄下，控制臺運行 node app.js 即可啟動一個本地服務器了。 /** * 服務器 * Author je

用python寫一個簡單的詞法分析器

編譯原理老師要求寫一個java的詞法分析器，想了想決定用python寫一個。目標能識別出變數，數字，運算子，界符和關鍵字，用excel表打印出來。有了目標，想想要怎麼實現詞法分析器。 1.先進行預處理，把註釋，多餘的空格，空行去掉。 2.一行一行掃

Spark Mllib構建簡單的電影推薦系統（轉）

基於模型的協同過濾應用–電影推薦資料來源：資料本文實現對使用者推薦電影的簡單應用。 1、測試資料描述本次測試資料主要包括四個資料檔案：（詳細的資料描述參見README檔案）

用python寫一個簡單計算器

1、利用迴圈新增按鈕部件，及給每個按鈕設定訊號/槽2、給按鈕設定固定大小：button.setFixedSize(QtCore.QSize(60,30))3、取事件的的傳送者（此例為各個按鈕）的文字： self.sender().text()#簡易計算器 import sys

用python寫一個簡單的使用者登陸程式(要求寫成函式)

效能要求：原始碼： dict1={} def log(): global dict1 print("|---新建使用者：N/n---|") print("|---賬戶登入：

Python下用Scrapy和MongoDB構建爬蟲系統（1）

這篇文章將根據真實的兼職需求編寫一個爬蟲，使用者想要一個Python程式從Stack Overflow抓取資料，獲取新的問題（問題標題和URL）。抓取的資料應當存入MongoDB。值得注意的是，Stack Overflow已經提供了可用於讀取同樣資料的API。但是使用者想要一個

用Python寫個簡單的推薦系統（一）

1. 建立影評評分字典

2. 關於歐幾里得距離和計算

3. 在python直譯器中秋歐幾里得距離例子：

4. 計算相似度（歐幾里得）

5. 呼叫該函式，分別傳入兩個人的名字，並計算出相似度的評價值

皮爾遜相關係數評估相似度

6. 關於皮爾遜相關係數

7. 用皮爾遜相關度定義函式

8. 用皮爾遜相關係數的recommendations1 模組求相關評價值

9. 相似度排名列表

10. 得到有關影評者相似度評價值的列表

用python做個彈球遊戲（一）

用Python寫個簡單的推薦系統（一）

使用Mahout實現推薦系統（一）：MySQL資料來源的簡單推薦

推薦系統（一）基於協同過濾演算法開發離線推薦

推薦系統（一）評測指標

推薦系統（一） —— 好的推薦系統

基於Spark MLlib平臺和基於模型的協同過濾演算法的電影推薦系統（一）協同過濾演算法概述&&基於模型的協同過濾的演算法思想（演算法模型和結構待補充）

用Python實現古詩詞填字遊戲（一）

知識圖譜+推薦系統（一）

用python寫一個簡單的推薦系統

用python寫一個簡單的excel表格獲取當時的linux系統信息

用python做推薦系統（二）

用python寫個隨機驗證碼

女朋友是機票販子？用Python寫個刷飛機票的指令碼！生活費多了兩百

用node寫個簡單的靜態服務器

用python寫一個簡單的詞法分析器

Spark Mllib構建簡單的電影推薦系統（轉）

用python寫一個簡單計算器

用python寫一個簡單的使用者登陸程式(要求寫成函式)

Python下用Scrapy和MongoDB構建爬蟲系統（1）

用Python寫個簡單的推薦系統（一）

1. 建立影評評分字典

2. 關於歐幾里得距離和計算

3. 在python直譯器中秋歐幾里得距離例子：

4. 計算相似度（歐幾里得）

5. 呼叫該函式，分別傳入兩個人的名字，並計算出相似度的評價值

皮爾遜相關係數評估相似度

6. 關於皮爾遜相關係數

7. 用皮爾遜相關度定義函式

8. 用皮爾遜相關係數的recommendations1 模組求相關評價值

9. 相似度排名列表

10. 得到有關影評者相似度評價值的列表

相關推薦