win10(64位)下安裝tesseract和tesserocr出現問題以及解決辦法
tesserocr是Python的一個OCR識別庫,但其實是對tesseract做的一層Python API封裝,所以它的核心是tesseract。因此,在安裝tesseroct之前,我們必須安裝tesseract。
- tesseract安裝
其中檔案中帶有dev的為開發版本,不帶dev的為穩定版本,可以選擇不帶dev版本的,例如我下載的是tesseract-ocr-setup-3.05.02-20180621.exe。
下載完成後雙擊安裝,一路點選NEXT,注意下邊圖形勾選就行了
安裝時間比較長,耐心等待。安裝好了之後,需要將其路徑加入兩個環境變數,一個是path,一個是TESSDATA_PREFIX。如下圖
然後cmd開啟命令列,輸入
>>>tesseract -v
這樣就完成tesseract安裝了。
- tesserocr安裝
自己安裝了Anaconda3-5.3.0,可以直接用pip安裝,但是用pip3 install tesserocr時,出現以下如下圖情況。
當我按照要求去官網下載了VC++14.0後,然後又輸入pip3 install tesserocr,又出現同樣錯誤。然後去tesserocr官網(
再次輸入pip3 install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl(intall後面是tesserocr安裝路徑,cp表示py是3.6的,win_amd64表示64位),發現還是不對,因為自己的Anaconda3-5.3.0的python版本是3.7的,於是又採取的py降級降到3.6。程式碼如下所示
>>>conda update conda /*等待完成更新,然後輸入以下命令*/
>>>conda creat -n py36 python=3.6 anaconda /*等待更新完*/
>>>Proceed ([y]/n)? /*如果降級遇到這個情況,後面輸入y表示覆蓋之前py版本,n表示不覆蓋*/
>>>activate py36 /*安裝好之後,如若使用py36,啟用py36就行,如下所示*/
C:\Users\斌玲>activate py36
(py36) C:\Users\斌玲> /*出現上述兩行就表示降級完成了*/
然後命令列輸入pip install C:\Users\斌玲\tesserocr-2.2.2-cp36-cp36m-win_amd64.whl,安裝成功了,如下圖
中間如果不成功的話,報錯 tesserocr-2.2.2-cp36-cp36m-win_amd64.whl is not a supported wheel on this platform的話,可以嘗試在python裡輸入:
然後根據要求其上檔名改就是了。