1. 程式人生 > 實用技巧 >Python 爬蟲中 wad庫的‘gbk‘編碼問題

Python 爬蟲中 wad庫的‘gbk‘編碼問題

Python 爬蟲中 wad庫的'gbk'編碼問題

最近開始學習python的爬蟲。
在呂雲翔等編寫的Python網路爬蟲-從入門到精通一書之中,在介紹檢視網站所用的技術時,提到了使用wad庫的方法。
但我在使用的過程中遇到了如下的問題:
IDLE介面的問題
在這裡插入圖片描述
在這裡插入圖片描述
這裡先直接給出解決的方法。
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
開啟到clues.py, 找到第46行,在open函式中增加encoding=‘utf-8’這項引數。之後儲存了就可以正常的執行程式了。
在這裡插入圖片描述

下面是我個人的尋找經歷…
首先是去網上直接查、但是關於wad庫基本就沒有任何的資訊。通過提示資訊我大概知道是gbk編碼的問題,於是又在這方面找了很久,有看到open函式中關於編碼引數的講解,可是因為封裝的原因,不知道怎麼就著提供的detect等函式來修改相關的編碼引數。也嘗試過修改系統的預設編碼,可是最終發現系統的預設編碼就是‘utf-8’.最終只能暴力的去修改庫了…

總而言之就是json在開啟檔案時候的編碼問題,因為wad庫的相關內容很少,所以我決定還是寫一篇部落格,看看能不能幫到遇到相同問題的人。