python中文字符串編碼問題
阿新 • • 發佈:2017-06-08
err har .json 情況 comm 常用 class not 字符串類型
接口測試的時候,發現接口返回內容是uncodie類型但是包含中文。在使用print進行打印時輸出提示錯誤:
UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 733-738: ordinal not in range(128)
查閱資料發現是由於內容中包含了中文字符,導致unix系統在print解析是無法正常解析導致。
源碼如下:
def _ejson(con): comm = "echo ‘%s‘ | python -m json.tool" % con return os.system(comm)if __name__ == "__main__": con =open(‘con.json‘,‘r‘) print _ejson(con)
經過查閱資料以及自我檢查
發現con返回的是unicode編碼的字符串,其中包換中文。導致print的時候解析失敗。
更改後的代碼如下:
def _ejson(con): con = con.encode(‘utf-8‘) comm = "echo ‘%s‘ | python -m json.tool" % con return os.system(comm) if __name__== "__main__": con =open(‘con.json‘,‘r‘) print _ejson(con)
問題得到完美解決。
附帶簡單說下python編碼的問題:
Python 有兩種字符串類型,str 與 unicode:
因為 Python 認為 16 位的 unicode 才是字符的唯一內碼,而大家常用的字符集如 gb2312,gb18030/gbk,utf-8,以及 ascii 都是字符的二進制(字節)編碼形式。
如果需要將非unicode的編碼的str轉換成unicode編碼,則需要使用decode進行解碼,反之如果希望把unicode編碼轉換成其他字符集則需要使用encode進行編碼。
例如:str.decode(‘utf-8‘) 將str轉換成unicode編碼
str.encode(‘utf-8‘)將str轉換成utf-8編碼
通常情況下,我們需要通過unicode編碼進行中轉換,進行不同類型編碼的相互之間轉換
例如:str.decode(‘gbk‘).encode(‘utf-8‘) 將str由gbk編碼變成utf-8編碼
python中文字符串編碼問題