1. 程式人生 > >資料探勘之擬合優度檢驗

資料探勘之擬合優度檢驗

本部落格根據非常好的excel資料而編寫,使用python語言操作,預計使用一週的時間更新完成。需要《非常好的excel資料》word文件,歡迎發郵件給[email protected],免費發放。這篇部落格對應《非常好的excel資料》裡的第4章節。

在這裡插入圖片描述在這裡插入圖片描述自由度v=(行數-1)(列數-1)
① 資料
在這裡插入圖片描述
②Python程式碼如下

def lilunpinshu(n,m,v,pingshu,qujianduandian):
    j=0
    a=[]
   # s=sum(tree111)
    s = sum(pingshu)
    for i in range(0,n):
        if i==0:
            aa=s*stats.norm.cdf(qujianduandian[i],m,v)
          ##  aa=s*stats.norm.cdf(tree113[i],m,v)
           
            a.append(aa)
        else:
            cc=stats.norm.cdf(qujianduandian[i],m,v)
            c=stats.norm.cdf(qujianduandian[i-1],m,v)
            a.append(s*(cc-c))
    return a

import pandas as pd 
from scipy import stats
from scipy.stats import chisquare
tree=pd.read_csv('D:\data.csv',encoding='gbk')
tree11=tree.iloc[0:12,7:]
tree111 = list(tree11['頻數'][:9])
tree112 = list(pd.to_numeric(tree11['理論頻數'][:9]))
tree113 = list(tree11['Unnamed: 10'][:9])

結果圖
在這裡插入圖片描述
在這裡插入圖片描述
所以此資料服從正態分佈

上一篇部落格:假設檢驗實驗
下一篇部落格:假設檢驗實驗和擬合優度檢驗練習題