【筆記】特徵臉（PCA在人臉識別領域的應用）

阿新 • • 發佈：2021-01-20

人臉識別與特徵臉（簡單介紹）

什麼是特徵臉

特徵臉（Eigenface）是指用於機器視覺領域中的人臉識別問題的一組特徵向量，該方法被認為是第一種有效的人臉識別方法。

（在notebook中）

我們需要載入相應的方法fetch_lfw_people，其為一個人臉識別資料庫，載入以後，就可以直接呼叫了，頭一次使用要下載，具體情況見另一篇部落格使用sklearn中的fetch_mldata的錯誤情況以及可能可行的解決方法，其中有說明

  from sklearn.datasets import fetch_lfw_people
  faces = fetch_lfw_people()

我們可以看到其中相應的內容

  faces.keys()

結果為

其中faces.data.shape
結果為

對應的faces.images.shape
結果為（第一個為樣本總數，對於每個樣本都是62*47的影象）

然後我們隨機出36張臉，首先對樣本進行一個隨機的排列，然後將隨機的排列放入X中，然後取出X中前36張臉，然後看一下對應的資料

  random_indexes = np.random.permutation(len(faces.data))
  X = faces.data[random_indexes]

  example_faces = X[:36,:]
  example_faces.shape

結果為

繪製函式：

  def plot_faces(faces):

      fig,axes = plt.subplots(6,6,figsize=(10,10),
                         subplot_kw={'xticks':[],'yticks':[]},
      gridspec_kw=dict(hspace=0.1,wspace=0.1))
      for i,ax in enumerate(axes.flat):
          ax.imshow(faces[i].reshape(62,47),cmap='bone')
      plt.show()

  plot_faces(example_faces)

影象為

可以使用faces.target_names來檢視包含的人名
結果為

具體的實現特徵臉

這裡使用PCA的另一種構建方式svd_solver引數，讓其等於randomized，希望使用隨機的方式求解PCA（對所有的資料），這樣來例項化pca，然後進行fit

  %%time
  from sklearn.decomposition import PCA
  pca = PCA(svd_solver='randomized')
  pca.fit(X)

結果為

使用pca.components_.shape來看一下有多少個維度及主成分
結果為

繪製圖像，注意，影象越靠前，越能反映整個樣本的總特徵

  plot_faces(pca.components_[:36,:])

影象為（這些就被稱為特徵臉）

因為有很多的圖片是一個人一張，而有一些是一個人有很多張，這樣出來的資料有的時候是不靠譜的，那麼我們就可以獲得樣本數比較多的人的圖片來增加準確度，我們可以

  faces2 = fetch_lfw_people(min_faces_per_person=60)

通過faces2.data.shape，可以發現這樣就會少很多

使用len(faces2.target_names)來看一下一共多少人名
結果為

這樣faces2中就只有8個人，每個人不少於60張圖片，這樣的資料庫就比較靠譜了

【筆記】特徵臉（PCA在人臉識別領域的應用）

人臉識別與特徵臉（簡單介紹）什麼是特徵臉特徵臉（Eigenface）是指用於機器視覺領域中的人臉識別問題的一組特徵向量，該方法被認為是第一種有效的人臉識別方法。

什麼是機器學習的特徵工程？【資料集特徵抽取（字典，文字TF-Idf）、特徵預處理（標準化，歸一化）、特徵降維（低方差，相關係數，PCA）】

2.特徵工程 2.1 資料集 2.1.1 可用資料集 Kaggle網址：https://www.kaggle.com/datasets UCI資料集網址： http://archive.ics.uci.edu/ml/

【筆記】go語言--（Slice）切片的概念

go--（Slice）切片的概念 //切片是什麼，定義一個arr，定義一個s為arr中的2到6，這個s就是一個切片

【BZOJ2724】蒲公英題解（分塊+區間眾數）

題目連結題目大意：給定一段長度為$n$的序列和$m$次詢問，每次詢問區間$[l,r]$內的最小的眾數。$n\\leq 40000,a_i\\leq 10^9$

JZOJ 6757 2020.07.21【NOI2020】模擬T3 （至少容斥+OGF+NTT）

題目大意：一個序列\$a[1..n](1 \\le n \\le N)\$，滿足： \$a[i] \\in [1,m]\$ \$a[i]<a[i+1]\$的對數\$=k\$

JZOJ 6756. 2020.07.21【NOI2020】模擬T2 （搜尋有用狀態+揹包dp）

題目大意： \$n\$種花色，每個花色\$m\$種數字，每個花色數字牌不超過\$4\$張的雀魂。

【LOJ6500】操作題解（差分+貪心+雜湊）

8月17日考試 T3 題目大意：給定一個$01$序列，每次可以選擇一個長度為$k$的區間取反。給定$q$次詢問，每次詢問$[l,r]$至少需要多少次操作才能使所有數變為$0$。

【筆記】nrf52832廣播使用--廠商自定義資料應用

　　需求：　　1）使用藍芽不停傳送ble廣播，傳送自定義的資料，並每一秒更新自定義資料。

【Java】時間轉換（可用於計算耗時場景）

public class TimeCalc { /** * 將指定數字轉換為時間（格式：00:00:00,000） * * @param timeNumber 如 216059999

【筆記】使用PCA對資料進行降噪（理解）

使用PCA對資料進行降噪（使用手寫數字例項）（在notebook中）載入庫並製作虛擬的資料並進行繪製

【筆記】scikit-learn中的PCA（真實資料集）

sklearn中的PCA（真實的資料集）（在notebook中）載入好需要的內容，手寫數字資料集

搭建測試專案（學習）【筆記】

一、新建一個專案 1.1、搭建專案環境 1.1.1、基本環境搭建 1、在File中選擇new，後再選擇Project，進入這個頁面後，選擇maven，Project SDK選擇1.8；

【筆記】陣列、SQL（2）

下列運算子中,不屬於關係運算符的是（）？答案：！！屬於邏輯運算子 1.算術運算子： - + / %

【學習筆記】字典樹（Trie）

【學習筆記】字典樹（Trie）日期：2020-08-25 目錄【學習筆記】字典樹（Trie）一、前言二、正文1. 概念2. 實現三、碎碎念

軟體設計師【軟考中級】複習筆記 —— 第九章（法律法規與標準化知識）

軟體設計師【軟考中級】複習筆記 —— 第九章（法律法規與標準化知識） 9.1 法律法規知識（智慧財產權）前言9.2 法律法規知識（保護期限）9.3 法律法規知識（智慧財產權人確定）9.4 法律法規知識（侵權判

【筆記】Robot Dynamics - Kinematics 超全總結（附程式碼）

參考資料： Robot Dynamics Lecture Notes：Robitics System Lab，ETH Zurich，HS 2017 Exercises 1 Matlab Coding 1

【筆記】USB（Universal Serial Bus）基礎知識筆記

概述 USB是一種常用的PC介面，USB2.0只有4根線（黑線：gnd；紅線：vcc；綠線：data+；白線：data-），其中2根電源線，2根訊號線，所以訊號是序列傳輸的，所以USB介面也稱為串列埠。USB3.0則採用9針腳設計。

【筆記】Linux就該這麼學-第十四課第十二（下）、十三章

NFS網路檔案系統 yuminstallnfs-utils 清空NFS伺服器上面iptables防火牆的預設策略 iptables-F

【筆記】【Android開發】悅讀-2（底部導航欄tabBar、頁面標題）

tabBar底部導航欄樣式（pages.jeon) \"tabBar\": { \"color\" : \"#707070\",//底部導航欄的顏色

【Google Earth Engine程式語言學習筆記】衛星資料（landsat）矩陣資料

一、【衛星資料landsat】（1）資料引入在資料框中輸入landsa，點選import引入（2）ImageCollection.qualityMosaic()對畫素級別進行操作，對所有影象集中，通過波段質量為每個畫素排序。

【筆記】特徵臉（PCA在人臉識別領域的應用）

人臉識別與特徵臉（簡單介紹）

相關推薦