大資料中,機器學習和資料探勘的聯絡與區別
阿新 • • 發佈:2018-12-15
資料探勘是從海量資料中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程。
資料探勘中用到了大量的機器學習界提供的資料分析技術和資料庫界提供的資料管理技術。
從資料分析的角度來看,資料探勘與機器學習有很多相似之處,但不同之處也十分明顯,例如,資料探勘並沒有機器學習探索人的學習機制這一科學發現任務,資料探勘中的資料分析是針對海量資料進行的,等等。
從某種意義上說,機器學習的科學成分更重一些,而資料探勘的技術成分更重一些。
學習能力是智慧行為的一個非常重要的特徵,不具有學習能力的系統很難稱之為一個真正的智慧系統,而機器學習則希望(計算機)系統能夠利用經驗來改善自身的效能,因此該領域一直是人工智慧的核心研究領域之一。
在計算機系統中,“經驗”通常是以資料的形式存在的,因此,機器學習不僅涉及對人的認知學習過程的探索,還涉及對資料的分析處理。
實際上,機器學習已經成為計算機資料分析技術的創新源頭之一。由於幾乎所有的學科都要面對資料分析任務,因此機器學習已經開始影響到電腦科學的眾多領域,甚至影響到電腦科學之外的很多學科。
機器學習是資料探勘中的一種重要工具。然而資料探勘不僅僅要研究、拓展、應用一些機器學習方法,還要通過許多非機器學習技術解決資料倉儲、大規模資料、資料噪聲等實踐問題。機器學習的涉及面也很寬,常用在資料探勘上的方法通常只是“從資料學習”。
然而機器學習不僅僅可以用在資料探勘上,一些機器學習的子領域甚至與資料探勘關係不大 ,如增強學習與自動控制等。所以,資料探勘是從目的而言的,機器學習是從方法而言的,兩個領域有相當大的交集,但不能等同。