機器學習實戰第三章——決策樹程式

阿新 • • 發佈：2019-01-28

在閱讀理解決策樹之後，按照《機器學習實戰》的程式碼，實現ID3決策樹

程式如下：

from math import log
def calcShannonEnt(dataSet):
numEntries = len(dataSet)
labelCounts = {}
for featVec in dataSet:
currentLabel = featVec[-1]
if currentLabel not in labelCounts.keys():
labelCounts[currentLabel] = 0
labelCounts[currentLabel] += 1
shannonEnt=0.0
for key in labelCounts:
prob = float(labelCounts[key])/numEntries
shannonEnt -= prob*log(prob,2)
return shannonEnt

def createDataSet():
dataSet = [[1,1,'yes'],
[1,1,'yes'],
[1,0,'no'],
[0,1,'no'],
[0,1,'no']]
labels = ['no surfacing','flippers']
return dataSet , labels

def splitDataSet(dataSet,axis,value):
retDataSet = []
for featVec in dataSet:
if featVec[axis] ==value:
reducedFeatvec = featVec[:axis]
reducedFeatvec.extend(featVec[axis+1:])
retDataSet.append(reducedFeatvec)
return retDataSet

def chooseBestFeatureToSplit(dataSet):
numFeatures = len(dataSet[0])-1
baseEntropy = calcShannonEnt(dataSet)
bestInfoGain = 0.0 ; bestFeature=-1
for i in range(numFeatures):
featList = [example[i] for example in dataSet]
uniqueVals = set(featList)
newEntropy =0.0
for value in uniqueVals:
subDataSet = splitDataSet(dataSet,i,value)
prob = len (subDataSet)/float(len(dataSet))
newEntropy+=prob*calcShannonEnt(subDataSet)
infoGain = baseEntropy - newEntropy
print infoGain
if (infoGain>bestInfoGain):
bestInfoGain = infoGain
bestFeature = i
return bestFeature

機器學習實戰第三章——決策樹程式

機器學習實戰第三章——決策樹程式

機器學習實戰第三章——決策樹(原始碼解析)

《機器學習》第三章決策樹學習筆記加總結

機器學習實戰(第三篇)-決策樹簡介

機器學習實戰(第三篇)-決策樹構造

機器學習實踐-第三章決策樹

機器學習實戰—第9章：樹迴歸程式程式碼中的小錯誤

機器學習實戰第三章程式碼3-2註釋

《機器學習實戰》第三章----決策樹

《機器學習實戰》第三章決策樹程式碼

機器學習實戰python版第三章決策樹程式碼理解

《機器學習》讀書筆記，第三章決策樹學習

《機器學習》周志華學習筆記第四章決策樹（課後習題）python 實現

機器學習實戰第九章回歸樹錯誤

第三章決策樹

機器學習實戰第五章Logistic回歸

機器學習實戰第7章——利用AdaBoost元算法提高分類性能

機器學習實戰第8章預測數值型數據：回歸

機器學習實戰（二）決策樹DT（Decision Tree、ID3演算法）

機器學習實戰讀書筆記(2)--決策樹

機器學習實戰第三章——決策樹程式

相關推薦