1. 程式人生 > 程式設計 >Python3的unicode編碼轉換成中文的問題及解決方案

Python3的unicode編碼轉換成中文的問題及解決方案

這篇文章主要介紹了Python3的unicode編碼轉換成中文的問題及解決方案,文中通過示例程式碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

從別的地方搬過來的,擔心以後不容易搜尋到,就收集過來。

我當時面臨的問題是要從C++發json程式碼出來,用python寫了個server,然後返回給C++程式,結果收到的是:

httpSvrDataCbUser: {"tranNO": "0808ad498670dc996","data": "\u65b0A1EY16","ver": "1.0","sendTime": "2019-12-10 00:23:51","tranType": "2001"} 

我發過去的是utf-8編碼,中間有中文,"新A1EY16",結果發回來的卻是:"\u65b0A1EY16"

9102年,大部分人已經受盡了python2裡面unicode的折磨,轉向了python3。

python3似乎對一切的unicode都那麼的友好,當一個字串裡存在unicode的時候,只要字串是硬編碼的,就可以轉換成中文列印在控制檯上,如:

s = ‘\u7b14\u8bb0'
print(s)

你得到的就是中文漢字。

但是,假如你。。的這段含有‘\u'的unicode編碼不是硬編碼進指令碼的,而是通過requests在網上爬的。。。那麼你會發現,你打印出來的,還是長這樣的unicode編碼,換句話說,直譯器這個時候根本就沒認出這東西原來是unicode編碼,當成普通的字元序列了。

百度找到了最好的解決方法:在這個unicode串後面加上:

s = s.decode().encode(‘unicode_escape')
print(s)

它就打印出漢字了

python3中沒有這種問題,所以最簡單的方法是引入__future__模組,把新版本的特性匯入到當前版本

from __future__ import unicode_literals
print json.dumps(m,ensure_ascii=False)
=>{"a": "你好"}

在寫入檔案的時候出現了Python2.7的UnicodeEncodeError: ‘ascii' codec can't encode異常錯誤

大神的解決方法:

不使用open開啟檔案,而使用codecs:

from __future__ import unicode_literals
import codecs
fp = codecs.open('output.txt','a+','utf-8')
fp.write(json.dumps(m,ensure_ascii=False))
fp.close()

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。