序列化模組:json模組
一、序列化
什麼叫序列化——將原本的字典、列表等內容轉換成一個字串的過程就叫做序列化。
序列化的目的:
1、以某種儲存形式使自定義物件持久化;
2、將物件從一個地方傳遞到另一個地方。
3、使程式更具維護性
用於序列化的兩個模組
json,用於字串 和 python資料型別間進行轉換
pickle,用於python特有的型別 和 python的資料型別間進行轉換
Json模組提供了四個功能:dumps、dump(序列化,存)、loads、load(反序列化,讀)
pickle模組提供了四個功能:dumps、dump(序列化,存)、loads(反序列化,讀)、load (不僅可以序列化字典,列表...可以把python中任意的資料型別序列化)
二、json模組
Json模組提供了四個功能:dumps、dump、loads、load
jumps序列化:將一個字典轉換成一個字串
loads反序列化:將一個字串格式的字典轉換成一個字典
dump方法接收一個檔案控制代碼,直接將字典轉換成json字串寫入檔案
load方法接收一個檔案控制代碼,直接將檔案中的json字串轉換成資料結構返回
2.1功能說明
import json dic = {'k1':'v1','k2':'v2','k3':'v3'} str_dic = json.dumps(dic) #序列化:將一個字典轉換成一個字串 print(type(str_dic),str_dic) #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"} #注意,json轉換完的字串型別的字典中的字串是由""表示的 dic2 = json.loads(str_dic) #反序列化:將一個字串格式的字典轉換成一個字典 #注意,要用json的loads功能處理的字串型別的字典中的字串必須由""表示 print(type(dic2),dic2) #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'} list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}] str_dic = json.dumps(list_dic) #也可以處理巢狀的資料型別 print(type(str_dic),str_dic) #<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}] list_dic2 = json.loads(str_dic) print(type(list_dic2),list_dic2) #<class 'list'> [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}] 複製程式碼 複製程式碼, import json f = open('json_file','w') dic = {'k1':'v1','k2':'v2','k3':'v3'} json.dump(dic,f) #dump方法接收一個檔案控制代碼,直接將字典轉換成json字串寫入檔案 f.close() f = open('json_file') dic2 = json.load(f) #load方法接收一個檔案控制代碼,直接將檔案中的json字串轉換成資料結構返回 f.close() print(type(dic2),dic2) 複製程式碼 複製程式碼,中文格式 import json f = open('file','w') json.dump({'國籍':'中國'},f) ret = json.dumps({'國籍':'中國'}) f.write(ret+'\n') json.dump({'國籍':'美國'},f,ensure_ascii=False) ret = json.dumps({'國籍':'美國'},ensure_ascii=False) f.write(ret+'\n') f.close() 複製程式碼 複製程式碼,其他引數 Serialize obj to a JSON formatted str.(字串表示的json物件) Skipkeys:預設值是False,如果dict的keys內的資料不是python的基本型別(str,unicode,int,long,float,bool,None),設定為False時,就會報TypeError的錯誤。此時設定成True,則會跳過這類key ensure_ascii:,當它為True的時候,所有非ASCII碼字元顯示為\uXXXX序列,只需在dump時將ensure_ascii設定為False即可,此時存入json的中文即可正常顯示。) If check_circular is false, then the circular reference check for container types will be skipped and a circular reference will result in an OverflowError (or worse). If allow_nan is false, then it will be a ValueError to serialize out of range float values (nan, inf, -inf) in strict compliance of the JSON specification, instead of using the JavaScript equivalents (NaN, Infinity, -Infinity). indent:應該是一個非負的整型,如果是0就是頂格分行顯示,如果為空就是一行最緊湊顯示,否則會換行且按照indent的數值顯示前面的空白分行顯示,這樣打印出來的json資料也叫pretty-printed json separators:分隔符,實際上是(item_separator, dict_separator)的一個元組,預設的就是(‘,’,’:’);這表示dictionary內keys之間用“,”隔開,而KEY和value之間用“:”隔開。 default(obj) is a function that should return a serializable version of obj or raise TypeError. The default simply raises TypeError. sort_keys:將資料根據keys的值進行排序。 To use a custom JSONEncoder subclass (e.g. one that overrides the .default() method to serialize additional types), specify it with the cls kwarg; otherwise JSONEncoder is used. 複製程式碼 import json data = {'username':['李華','二愣子'],'sex':'male','age':16} #data是資料,sort_keys是根據值排序,indent是單位空格縮排,separators是分隔符,ensure_ascii是是否支援中文 json_dic2 = json.dumps(data,sort_keys=True,indent=2,separators=(',',':'),ensure_ascii=False) print(json_dic2)
2.2 注意事項:
1.json格式的限制,json格式的key必須是字串資料型別
json格式中的字串只能是“”雙引號,不能是‘’單引號
如果是key不是字串資料型別,那麼會強制轉為字串資料型別
2.json是否支援元組:對元組做value的字典會把元組強制轉換為列表
3.json是否支援元組做key:不支援
4.對列表dump:還是列表
5.能不能多次dump資料到檔案裡:只支援多次寫dump,不支援多次讀load
如需強行用json模組多次dump,需用dumps轉換,然後用for line in f,用json.loads(line)迴圈反序列化
6.使用ensure_ascii=False可以支援中文格式
7.set型別不能被dump/dumps,其中的資料型別識別會有問題
8.雖然支援的資料型別有限,但是方便json程式處理資料
三、pickle模組
pickle模組提供了四個功能:dumps、dump(序列化,存)、loads(反序列化,讀)、load (不僅可以序列化字典,列表...可以把python中任意的資料型別序列化)
pickle支援幾乎所有物件的,但是序列化後得到的都是一串二進位制內容
3.1 功能說明
import pickle
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = pickle.dumps(dic)
print(str_dic) #一串二進位制內容
dic2 = pickle.loads(str_dic)
print(dic2) #字典
import time
struct_time = time.localtime(1000000000)
print(struct_time)
f = open('pickle_file','wb')
pickle.dump(struct_time,f)
f.close()
f = open('pickle_file','rb')
struct_time2 = pickle.load(f)
print(struct_time2.tm_year)