1. 程式人生 > >利用百度AI OCR圖片識別,Java實現PDF中的圖片轉換成文字

利用百度AI OCR圖片識別,Java實現PDF中的圖片轉換成文字

序言:我們在讀一些PDF版書籍的時候,如果PDF中不是圖片,做起讀書筆記的還好;如果PDF中的是圖片的話,根本無法編輯,做起筆記來,還是很痛苦的。我是遇到過了。我們搞技術的,當然得自己學著解決現在的痛點。

一. 現狀

為了不重複造輪子,當然得看看現在市面上是否有已經實現過的,如果有,那自然是拿來即用。

首先,說說一些線上版的PDF圖片轉文字,對檔案大小有限制為2M(似乎有很多的檔案處理都是限制在這個數),超過了便要收費了。

第二,那就是WPS的PDF圖片轉文字了。別說大小限制了,直接是收費。

二. 方案實現

2.1 百度AI平臺 獲取AppID, API Key, Secret Key

該平臺限制呼叫次數, 作為個人開發者來說,基本上是夠用了。

Java SDK文件使用說明: https://ai.baidu.com/docs#/OCR-Java-SDK/top

不清楚的,可以去看文件。

2.2 程式碼實現

邏輯思路: 讀取PDF檔案,然後讀取PDF中包含的圖片,將圖片傳給百度AI平臺去進行識別,返回結果解析。

第一步:新建一個Demo的Maven工程

省略....(相信大家都會哈)