Python3的unicode編碼轉換成中文的問題及解決方案
阿新 • • 發佈:2020-01-09
這篇文章主要介紹了Python3的unicode編碼轉換成中文的問題及解決方案,文中通過示例程式碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
從別的地方搬過來的,擔心以後不容易搜尋到,就收集過來。
我當時面臨的問題是要從C++發json程式碼出來,用python寫了個server,然後返回給C++程式,結果收到的是:
httpSvrDataCbUser: {"tranNO": "0808ad498670dc996","data": "\u65b0A1EY16","ver": "1.0","sendTime": "2019-12-10 00:23:51","tranType": "2001"}
我發過去的是utf-8編碼,中間有中文,"新A1EY16",結果發回來的卻是:"\u65b0A1EY16"
9102年,大部分人已經受盡了python2裡面unicode的折磨,轉向了python3。
python3似乎對一切的unicode都那麼的友好,當一個字串裡存在unicode的時候,只要字串是硬編碼的,就可以轉換成中文列印在控制檯上,如:
s = ‘\u7b14\u8bb0' print(s)
你得到的就是中文漢字。
但是,假如你。。的這段含有‘\u'的unicode編碼不是硬編碼進指令碼的,而是通過requests在網上爬的。。。那麼你會發現,你打印出來的,還是長這樣的unicode編碼,換句話說,直譯器這個時候根本就沒認出這東西原來是unicode編碼,當成普通的字元序列了。
百度找到了最好的解決方法:在這個unicode串後面加上:
s = s.decode().encode(‘unicode_escape') print(s)
它就打印出漢字了
python3中沒有這種問題,所以最簡單的方法是引入__future__模組,把新版本的特性匯入到當前版本
from __future__ import unicode_literals print json.dumps(m,ensure_ascii=False) =>{"a": "你好"}
在寫入檔案的時候出現了Python2.7的UnicodeEncodeError: ‘ascii' codec can't encode異常錯誤
大神的解決方法:
不使用open開啟檔案,而使用codecs:
from __future__ import unicode_literals import codecs fp = codecs.open('output.txt','a+','utf-8') fp.write(json.dumps(m,ensure_ascii=False)) fp.close()
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。