1. 程式人生 > >python中文字符串編碼問題

python中文字符串編碼問題

err har .json 情況 comm 常用 class not 字符串類型

接口測試的時候,發現接口返回內容是uncodie類型但是包含中文。在使用print進行打印時輸出提示錯誤:

UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 733-738: ordinal not in range(128)

查閱資料發現是由於內容中包含了中文字符,導致unix系統在print解析是無法正常解析導致。

源碼如下:

def _ejson(con):
    comm = "echo ‘%s‘ | python -m json.tool" % con
    return os.system(comm)

if __name__ == "__main__": con =open(con.json,r) print _ejson(con)

經過查閱資料以及自我檢查

發現con返回的是unicode編碼的字符串,其中包換中文。導致print的時候解析失敗。

更改後的代碼如下:

def _ejson(con):
    con = con.encode(utf-8‘)
    comm = "echo ‘%s‘ | python -m json.tool" % con
    return os.system(comm)

if __name__
== "__main__": con =open(con.json,r) print _ejson(con)

問題得到完美解決。

附帶簡單說下python編碼的問題:

Python 有兩種字符串類型,str 與 unicode:

因為 Python 認為 16 位的 unicode 才是字符的唯一內碼,而大家常用的字符集如 gb2312,gb18030/gbk,utf-8,以及 ascii 都是字符的二進制(字節)編碼形式。

如果需要將非unicode的編碼的str轉換成unicode編碼,則需要使用decode進行解碼,反之如果希望把unicode編碼轉換成其他字符集則需要使用encode進行編碼。

例如:str.decode(‘utf-8‘) 將str轉換成unicode編碼

   str.encode(‘utf-8‘)將str轉換成utf-8編碼

通常情況下,我們需要通過unicode編碼進行中轉換,進行不同類型編碼的相互之間轉換

例如:str.decode(‘gbk‘).encode(‘utf-8‘) 將str由gbk編碼變成utf-8編碼



python中文字符串編碼問題