python中文字符串編碼問題

阿新 • • 發佈：2017-06-08

err har .json 情況 comm 常用 class not 字符串類型

接口測試的時候，發現接口返回內容是uncodie類型但是包含中文。在使用print進行打印時輸出提示錯誤：

UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 733-738: ordinal not in range(128)

查閱資料發現是由於內容中包含了中文字符，導致unix系統在print解析是無法正常解析導致。

源碼如下：

def _ejson(con):
    comm = "echo ‘%s‘ | python -m json.tool" % con
    return os.system(comm)

 
if __name__ == "__main__":
    con =open(‘con.json‘,‘r‘)
    print _ejson(con)

經過查閱資料以及自我檢查

發現con返回的是unicode編碼的字符串，其中包換中文。導致print的時候解析失敗。

更改後的代碼如下：

def _ejson(con):
    con = con.encode(‘utf-8‘)
    comm = "echo ‘%s‘ | python -m json.tool" % con
    return os.system(comm)

if __name__ 
 == "__main__":
    con =open(‘con.json‘,‘r‘)
    print _ejson(con)

問題得到完美解決。

附帶簡單說下python編碼的問題：

Python 有兩種字符串類型，str 與 unicode：

因為 Python 認為 16 位的 unicode 才是字符的唯一內碼，而大家常用的字符集如 gb2312，gb18030/gbk，utf-8，以及 ascii 都是字符的二進制（字節）編碼形式。

如果需要將非unicode的編碼的str轉換成unicode編碼，則需要使用decode進行解碼，反之如果希望把unicode編碼轉換成其他字符集則需要使用encode進行編碼。

例如：str.decode(‘utf-8‘) 將str轉換成unicode編碼

　　　str.encode(‘utf-8‘)將str轉換成utf-8編碼

通常情況下，我們需要通過unicode編碼進行中轉換，進行不同類型編碼的相互之間轉換

例如：str.decode(‘gbk‘).encode(‘utf-8‘) 將str由gbk編碼變成utf-8編碼

python中文字符串編碼問題

err har .json 情況 comm 常用 class not 字符串類型接口測試的時候，發現接口返回內容是uncodie類型但是包含中文。在使用print進行打印時輸出提示錯誤： UnicodeEncodeError: ‘ascii‘ codec can‘t e

python中字符串編碼轉換

utf-8 str 一個 bubuko nic 你好 bsp encode tro 字符串編碼轉換程序員最苦逼的地方，什麽亂碼之類的幾乎都是由漢字引起的。其實編碼問題很好搞定，只要記住一點：任何平臺的任何編碼，都能和Unicode互相轉換。 UTF-8與GBK互相轉換，

wprintf、wcout輸出中文和unicode中文字符串的轉換問題

fan 5% 轉換問題 int 字符串 ssa dst unicode zed %E4%BD%BF%E7%94%A8CHttpFile%E4%BB%8E%E6%9C%8D%E5%8A%A1%E5%99%A8%E7%AB%AF%E6%AD%A3%E7%A1%AE%E7%9A%

python中字符串(str)的常用處理方法

num replace 不同的 swa pos track con strong 位置 str=‘Python String function‘ 生成字符串變量str=‘python String function‘字符串長度獲取：len(str)例：print ‘%

Python中字符串的表示

friend target follow pst tar spf aid hms lan 區別於其他語言，python中字符串可以用3中方法表示，且都能被正確編譯： 1、‘mary‘ 單引號括起來 2、"it‘s a great day" 雙引號括起來 3、‘‘‘ 　　ni

python中字符串中一些函數的用法

strip() strip 左右 art orm 是不是必須執行 count() 1..capitalize()：字符串的首字母大寫； 2..count()：字符串中的某個字母的個數； 3..center(50,‘-‘)：對象居中，且左右用‘-’補齊； 4..enco

python中字符串的內置方法

修改 rst form part 異常 attr_ 是否 sta 賦值這裏說的是字符串中的內置方法，畢竟字符串是最常用的操作對象。 [‘__add__‘, ‘__class__‘, ‘__contains__‘, ‘__delattr__‘, ‘__doc__‘, ‘__

201671010127 2016-2017-11 從鍵盤讀入中文字符串遇到的問題

scanner 然而發現 ges 沒有技術 ner new 其中　　上周測試戶籍管理系統時，我偶然發現了一個問題，在IDE下運行該程序時，如果輸入為中文字符串時會遇到一些問題。下面我就以一個簡單的程序來演示該問題：　　首先我先寫一個從鍵盤讀入一個中文字符串，然後輸出

Python中字符串、列表、元組、字典

python、運維1.字符串字符串四種定義方式：' ' " " ''' ''' """ """字符串的下標和切片:如: name = abcd

Python中字符串表示str與repr

error: int recent rep 數字整型機器理解 *** 所有通過Python打印的字符串還是被引號括起來的。這是因為Python打印值的時候會保持該值在Python代碼中的狀態，而不是你希望用戶看到的狀態，如果使用print 語句，結果就不一樣了。>

解決Spring MVC @ResponseBody返回中文字符串亂碼問題

有效 per log bean dia media converter 原因 ons 引起亂碼原因為spring mvc使用的默認處理字符串編碼為ISO-8859-1 具體參考org.springframework.http.converter.StringHttpMess

逆向---01.Nop、中文字符串搜索、保存修改後程序

class target down get blog ctrl 反匯編生成文件輸入基礎知識：（Nop：刪除跳轉） gcc編譯鏈接命令： gcc -o 生成文件名源文件名 gcc編譯成匯編代碼：gcc -o 生成文件名 -S 源文件名 VS查看匯編代碼：（調試

將int數字轉為中文字符串

blog arr num rec intval elseif pos val != 1 function int_to_cnstr($intval) { 2 $cnNum = array(‘零‘,‘一‘,‘二‘,‘三‘,‘四‘,‘五‘,‘六‘,‘七‘,‘八‘,

python中字符串和列表只是匯總

.so join方法 gpo copy col 返回值介紹運算 AC 字符串知識匯總字符串是描述變量的重要信息，其中的應用也是很多，很重要的一點就是StringBuilder。今天我們會為大家介紹一下常用的StringBuilder 1 strip lstrip rs

python 中字符串中含變量方法

hid 運行 nth clas format abc gif ima pen 1. 簡單粗魯的字符串拼接 1 name = "abc" 2 age = 25 3 info = "the name is "+name +"\nthe age is " + str(age)

Python中字符串的常用方法

lap 分享圖片大於 sdi errors enc lin dig 區分按索引取值字符串是不可變類型，並不能改變字符串的值最多可以有三個參數，分別是起始位置，結束為止和步長，可以正向取值，反響取值（起始位置大於結束位置或者沒有起始位置與結束位置，步長為-1表示

關於python中字符串的操作方法

反轉補充 per 14. 防止 cas 愛好是否 apc 1.capitalize() 首字母大寫 1 s = ‘helloPython‘ 2 s1 = s.capitalize() #首字母大寫 3 print(s1) #輸出結果：Hellopyt

python中字符串的操作方法

數量 ror tle 列表格式 dig 集合都是 2018年 python中字符串的操作方法大全更新時間：2018年06月03日 10:08:51 作者：駿馬金龍我要評論這篇文章主要給大家介紹了關於python中字符串操作方法的相關資料，文中通過示例代碼詳細介紹了

python 檢測字符串編碼類型是什麽

sci for decode value char chardet 檢測 asc dex for index,value in enumerate(listvalue): adchar=chardet.detect(value)

python中字符串前的r什麽意思

世界 raw 代碼 \n odi 9.png 編碼格式 utf-8 分享圖片 Python中，u表示unicode string，表示使用unicode進行編碼，沒有u表示byte string,類型是str，在沒有聲明編碼方式時，默認ASCI編碼。如果要指定編碼方式，可在

python中文字符串編碼問題

相關推薦