吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字符識別）

阿新 • • 發佈：2018-08-04

參考 https ocr 噪聲也說字符 www. 定位 cnblogs

http://www.cnblogs.com/xing901022/p/9374258.html

本章講述的是一個復雜的機器學習系統，通過它可以看到機器學習的系統是如何組裝起來的；另外也說明了一個復雜的流水線系統如何定位瓶頸與分配資源。

更多內容參考機器學習&深度學習

OCR的問題就是根據圖片識別圖片中的文字：

技術分享圖片這種OCR識別的問題可以理解成三個步驟：

文本檢測
字符切分
字符識別

文本檢測

文本的檢測可以用行人的檢測來做，思路差不多。

技術分享圖片

我們定義幾個固定大小尺寸的窗口，從照片的左上角開始掃描。掃描出來的圖像做二分類，判斷是北京還是人物（文字）。然後根據圖像處理的一些慣用手段做二值化、膨脹，使得文字區域連通。最終根據規則選擇文本框就可以了，過濾那些規則不規整、寬度比高度小的矩形框框，剩下的就是目標文本框了。技術分享圖片

字符切分

字符切分也可以理解成二分類問題，不過這裏的滑動窗口是固定大小。根據窗口內的內容判斷目標是分隔，還是文本。技術分享圖片

字符識別

最後的字符識別就很簡單了，找夠樣本，就可以做多分類了。跟手寫體識別一樣的玩法~ 技術分享圖片

關於訓練的樣本

其實訓練的樣本可以根據已有的樣本進行成倍的擴充。比如在做文字識別的時候，根據現有的圖片做一些變形、噪聲、旋轉等，再比如針對一些文字替換背景等等。技術分享圖片

關於系統的性能提升

針對系統準確性的提升可以把問題階段性的考慮，先判斷第一個環節的準確率，在判斷第二個環節。技術分享圖片

選擇準確率影響最關鍵的節點進行優化。

吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字符識別）

參考 https ocr 噪聲也說字符 www. 定位 cnblogs http://www.cnblogs.com/xing901022/p/9374258.html 本章講述的是一個復雜的機器學習系統，通過它可以看到機器學習的系統是如何組裝起來的；另外也說明了一

吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字符識別）

文本檢測

字符切分

字符識別

關於訓練的樣本

關於系統的性能提升

吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字符識別）

吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字元識別）

吳恩達機器學習筆記26-樣本和直觀理解2（Examples and Intuitions II）

吳恩達機器學習筆記26-樣本和直觀理解1（Examples and Intuitions I）

吳恩達機器學習筆記 —— 11 應用機器學習的建議

吳恩達機器學習筆記59-向量化：低秩矩陣分解與均值歸一化（Vectorization: Low Rank Matrix Factorization & Mean Normalization）

吳恩達機器學習筆記（十）-應用機器學習的建議

[吳恩達機器學習筆記]14降維1-2降維的應用資料壓縮與資料視覺化

Coursera-AndrewNg(吳恩達)機器學習筆記——第三周

吳恩達機器學習筆記 —— 5 多變量線性回歸

吳恩達機器學習筆記 —— 9 神經網絡學習

吳恩達機器學習筆記（六） —— 支持向量機SVM

吳恩達機器學習筆記 —— 17 推薦系統

吳恩達機器學習筆記 —— 12 機器學習系統設計

吳恩達機器學習筆記 —— 14 無監督學習

吳恩達機器學習筆記

吳恩達機器學習筆記1-機器學習概述

吳恩達機器學習筆記2-監督學習

吳恩達機器學習筆記4-單變量線性回歸

[吳恩達機器學習筆記]11機器學習系統設計5數據量對機器學習的影響

吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字符識別）

文本檢測

字符切分

字符識別

關於訓練的樣本

關於系統的性能提升

相關推薦