1. 程式人生 > 實用技巧 >序列化模組:json模組

序列化模組:json模組

目錄

一、序列化

什麼叫序列化——將原本的字典、列表等內容轉換成一個字串的過程就叫做序列化。
序列化的目的:
1、以某種儲存形式使自定義物件持久化;
2、將物件從一個地方傳遞到另一個地方。
3、使程式更具維護性

用於序列化的兩個模組
json,用於字串 和 python資料型別間進行轉換
pickle,用於python特有的型別 和 python的資料型別間進行轉換

Json模組提供了四個功能:dumps、dump(序列化,存)、loads、load(反序列化,讀)
pickle模組提供了四個功能:dumps、dump(序列化,存)、loads(反序列化,讀)、load (不僅可以序列化字典,列表...可以把python中任意的資料型別序列化)

二、json模組

Json模組提供了四個功能:dumps、dump、loads、load
jumps序列化:將一個字典轉換成一個字串
loads反序列化:將一個字串格式的字典轉換成一個字典
dump方法接收一個檔案控制代碼,直接將字典轉換成json字串寫入檔案
load方法接收一個檔案控制代碼,直接將檔案中的json字串轉換成資料結構返回

2.1功能說明

import json
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = json.dumps(dic)  #序列化:將一個字典轉換成一個字串
print(type(str_dic),str_dic)  #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"}
#注意,json轉換完的字串型別的字典中的字串是由""表示的

dic2 = json.loads(str_dic)  #反序列化:將一個字串格式的字典轉換成一個字典
#注意,要用json的loads功能處理的字串型別的字典中的字串必須由""表示
print(type(dic2),dic2)  #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}


list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}]
str_dic = json.dumps(list_dic) #也可以處理巢狀的資料型別 
print(type(str_dic),str_dic) #<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}]
list_dic2 = json.loads(str_dic)
print(type(list_dic2),list_dic2) #<class 'list'> [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]
複製程式碼

複製程式碼,
import json
f = open('json_file','w')
dic = {'k1':'v1','k2':'v2','k3':'v3'}
json.dump(dic,f)  #dump方法接收一個檔案控制代碼,直接將字典轉換成json字串寫入檔案
f.close()

f = open('json_file')
dic2 = json.load(f)  #load方法接收一個檔案控制代碼,直接將檔案中的json字串轉換成資料結構返回
f.close()
print(type(dic2),dic2)
複製程式碼

複製程式碼,中文格式
import json
f = open('file','w')
json.dump({'國籍':'中國'},f)
ret = json.dumps({'國籍':'中國'})
f.write(ret+'\n')
json.dump({'國籍':'美國'},f,ensure_ascii=False)
ret = json.dumps({'國籍':'美國'},ensure_ascii=False)
f.write(ret+'\n')
f.close()
複製程式碼

複製程式碼,其他引數
Serialize obj to a JSON formatted str.(字串表示的json物件) 
Skipkeys:預設值是False,如果dict的keys內的資料不是python的基本型別(str,unicode,int,long,float,bool,None),設定為False時,就會報TypeError的錯誤。此時設定成True,則會跳過這類key 
ensure_ascii:,當它為True的時候,所有非ASCII碼字元顯示為\uXXXX序列,只需在dump時將ensure_ascii設定為False即可,此時存入json的中文即可正常顯示。) 
If check_circular is false, then the circular reference check for container types will be skipped and a circular reference will result in an OverflowError (or worse). 
If allow_nan is false, then it will be a ValueError to serialize out of range float values (nan, inf, -inf) in strict compliance of the JSON specification, instead of using the JavaScript equivalents (NaN, Infinity, -Infinity). 
indent:應該是一個非負的整型,如果是0就是頂格分行顯示,如果為空就是一行最緊湊顯示,否則會換行且按照indent的數值顯示前面的空白分行顯示,這樣打印出來的json資料也叫pretty-printed json 
separators:分隔符,實際上是(item_separator, dict_separator)的一個元組,預設的就是(‘,’,’:’);這表示dictionary內keys之間用“,”隔開,而KEY和value之間用“:”隔開。 
default(obj) is a function that should return a serializable version of obj or raise TypeError. The default simply raises TypeError. 
sort_keys:將資料根據keys的值進行排序。 
To use a custom JSONEncoder subclass (e.g. one that overrides the .default() method to serialize additional types), specify it with the cls kwarg; otherwise JSONEncoder is used.
複製程式碼

import json
data = {'username':['李華','二愣子'],'sex':'male','age':16}
#data是資料,sort_keys是根據值排序,indent是單位空格縮排,separators是分隔符,ensure_ascii是是否支援中文
json_dic2 = json.dumps(data,sort_keys=True,indent=2,separators=(',',':'),ensure_ascii=False)
print(json_dic2)

2.2 注意事項:

1.json格式的限制,json格式的key必須是字串資料型別
json格式中的字串只能是“”雙引號,不能是‘’單引號
如果是key不是字串資料型別,那麼會強制轉為字串資料型別
2.json是否支援元組:對元組做value的字典會把元組強制轉換為列表
3.json是否支援元組做key:不支援
4.對列表dump:還是列表
5.能不能多次dump資料到檔案裡:只支援多次寫dump,不支援多次讀load
如需強行用json模組多次dump,需用dumps轉換,然後用for line in f,用json.loads(line)迴圈反序列化
6.使用ensure_ascii=False可以支援中文格式
7.set型別不能被dump/dumps,其中的資料型別識別會有問題
8.雖然支援的資料型別有限,但是方便json程式處理資料

三、pickle模組

pickle模組提供了四個功能:dumps、dump(序列化,存)、loads(反序列化,讀)、load (不僅可以序列化字典,列表...可以把python中任意的資料型別序列化)
pickle支援幾乎所有物件的,但是序列化後得到的都是一串二進位制內容

3.1 功能說明

import pickle
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = pickle.dumps(dic)
print(str_dic)  #一串二進位制內容

dic2 = pickle.loads(str_dic)
print(dic2)    #字典

import time
struct_time  = time.localtime(1000000000)
print(struct_time)
f = open('pickle_file','wb')
pickle.dump(struct_time,f)
f.close()

f = open('pickle_file','rb')
struct_time2 = pickle.load(f)
print(struct_time2.tm_year)

3.2 注意事項