python基礎===codecs打開文件,解決文件編碼格式的問題
阿新 • • 發佈:2018-01-19
class 文件 image 我們 bsp 需要 list col 技術分享
codecs
https://docs.python.org/3/library/codecs.html
我們經常用open打開文件的時候會出現各式各樣的錯誤,編碼格式的問題,等等~真的很煩
現在盡量使用codecs的方式打開文件
txt文檔是這樣的,使用open()的方式,打開直接報錯。
那麽使用codecs的方式,如下:
import codecs f = codecs.open("123.txt","r","utf-8") words = f.read()
基本使用到現在沒有出現錯誤!
為了獲取id我們還需要使用正則匹配
import re import codecs f= codecs.open(r"78.txt","r","utf-8") words = f.read() p = re.compile(‘ ID="(.*?)" IsException‘, re.S) ids = re.findall(p , words) #ids這裏是以list的形式儲存 s = ‘\n‘.join(ids) #每一項都換行打印 print(s)
>>>
最終得到id
python基礎===codecs打開文件,解決文件編碼格式的問題