DataWhale八月組隊學習-李巨集毅深度學習Task01-機器學習介紹

阿新 • • 發佈：2021-08-15

機器學習介紹

1 人類探索人工智慧的階段

人工智慧是早期人類探索的目標
- 人類設定好的天生本能
向著人工智慧這個大目標不斷邁進，我們發現了實現人工智慧的手段機器學習
深度學習就是機器學習的其中一種方法

2 生物的本能

河狸會構築水壩阻擋水流
- 河狸築壩的能力是天生的
  - 程式語言1（原視訊改良）：while ‘聽得見水流聲’ : 河狸築壩
  - 程式語言2（原視訊）：if '聽得見水流聲' : 河狸築壩直到聽不到水流聲
- 科學實驗：
  - 用揚聲器播放水流聲
  - 把揚聲器放在水泥牆裡面，河狸會用泥巴和樹枝來填充牆體
  - 如果將揚聲器放在平地，河狸會想辦法用材料將其蓋住

3 人類設定好的天生本能

想要自己去構建一個聊天機器
- 首先需要人為去設定一些規則
  - 比如：如果我們輸入turn off，機器就會執行turn off the music（關閉音樂）
  - 看上去很智慧，但是存在的問題現象是：如果我們說Please don't turn off the music，機器也會關閉音樂
- 人為制定規則的缺陷
  - 人類很難考慮到事件出現的所有可能性
    - 機器的能力永遠無法超越創造者（沒辦法自己freestyle）
  - 需要大量的人力去制定規則（對於小企業來說非常不友好）
AI
- 漫畫告訴我們：看似華麗外表對外界反應對答如流的機器，內部的演算法確實徒有其表，甚至可能只是最簡單的if
  
  巢狀。
- 真正AI的發展何去何從？- 讓機器具有自主學習的能力（機器學習思想的誕生）

4 機器學習方向的簡單定義

寫一段機器學習的程式，讓機器變得很聰明，從而具有學習能力
- 讓機器學習去識別語句對話，例如：Hi、How are you、Good bye。
- 學習識別語句對話後，給機器新的聲音，例如：Hello的語音片段。它會回答你這是Hello

從人類提供的資料中，找出需要掌握的特定學習能力函式。
- 語音識別
- 影像識別
- 圍棋大師
- 聊天機器人
找出學習能力函式的過程（監督學習）
- 所有學習能力函式對應的輸入輸出集合，被稱作Model，其中蘊含了很多不同的輸入輸出。
- 給予機器訓練集，告訴機器好的輸入輸出對應關係（學習能力函式）應該長什麼樣兒。
- 機器就可以決定Model中函式的好壞
- 但光知道好壞還不夠，機器需要能夠通過演算法挑出最好函式（最好的學習能力），即找到最優演算法。
- 掌握最好的函式後，機器要能夠舉一反三，即通過測試集中沒有見過的輸入得到對應正確的輸出。
- 上述過程可以用小例子的闡明：比如一個小孩子的成長過程中會遇到各色各樣的人，這些各色各樣的人都可能會影響小孩子，這些人的人生就是一個Model，蘊含很多不同的輸入輸出。機器訓練集，好比是我們家長提前假設好的預測，告訴孩子，從Model中選出不同的人，一個人認真學習，努力工作，享受生活，那麼他長大後會變得幸福快樂。另一個人荒廢學業，潦草度日，那麼他長大後會變得怨天尤人。家長會將前者的經歷作為訓練集中的一個例子來訓練小孩子，後者的經歷會被摒棄。從而讓小孩子向著健康成長的旅途邁進，掌握前者的人生能力。家長還可能想辦法找到最好的人生例子來教導孩子，也就好比機器需要通過演算法找出最好的函式。小孩子掌握後，就能夠在人生的旅途中通過觀察不同的人來判斷什麼樣的人應該被作為榜樣追隨，直到成為榜樣。

5 學習模式

5.1 監督學習(Supervised Learning)

Regression（迴歸）：它的輸出是一個數值
Classification（分類）：
- Binary Classification（二元分類）：它的輸出是Yes or No
- Multi-class Classification（多元分類）：它的輸出是正確類別
- 模型的選擇：
  - 線性模型
  - 非線性模型（包含Deep Learning、SVM、decision tree、K-NN...）
    - Image Recognition
    - Playing GO