1. 程式人生 > >機器學習(十三) 集成學習和隨機森林(下)

機器學習(十三) 集成學習和隨機森林(下)

img over 是你 trees https info 入門級 一點 競賽

五、隨機森林和 Extra-Trees

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

六、Ada Boosting 和 Gradient Boosting

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

七、Stacking

技術分享圖片

技術分享圖片

技術分享圖片

八、學習scikit-learn文檔,

官方學習文檔: http://scikit-learn.org

http://scikit-learn.org/stable/user_guide.html

今年,Kaggle剛剛上線了Kaggle Learn模塊,使用Kaggle的數據,來一點點進行機器學習實戰。可以參考:https://www.kaggle.com/learn/overview

其次,對於Kaggle的入門級比賽,有很好的Tutorial,請看這個頁面的所有Tutorial,只針對一個泰坦尼克數據,使用不同方案解決,是很好的步入機器學習競賽的第一步:https://www.kaggle.com/c/titanic#tutorials

Kaggle官方博客也有很多好的內容:http://blog.kaggle.com/

在你參加具體比賽的時候,Kaggle的論壇會是你的好幫手:https://www.kaggle.com/discussion

有人整理出了Kaggle比賽中很多問題的第一名的解決方案思路,其實這些內容都是引用上面Kaggle的官方博客或者論壇的內容:)

http://ndres.me/kaggle-past-solutions/

機器學習(十三) 集成學習和隨機森林(下)