20，序列化模块 json，pickle，shelve

序列化模块

什么叫序列化？

将原本的字典，列表等内容转换成一个字符串的过程叫做序列化。

序列化的目的？

数据结构通过序列化转成 str。

str 通过反序列化转化成数据结构。

json：

json模块提供了四个功能：dumps，dump，loads，load

loads 和 dumps

import json
# dic = {'k1':'v1','k2':'v2','k3':'v3'}
# str_dic = json.dumps(dic) ##注意，json转换完的字符串类型的字典中的字符串是由""表示的
# # print([str_dic],type(str_dic))#用列表能看出来是不是字符串。
# dict2 = json.loads(str_dic)##注意，要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
# print(type(dict2),dict2)#<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}

list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}]
list1 = json.dumps(list_dic).strip()#也可以处理嵌套的数据类型
print(type(list1),list1)#<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}]
list2 = json.loads(list1)
print(list2,type(list2))#[1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}] <class 'list'>

load 和 dump

f = open('json_file','w')#打开一个文件，如果没有该文件自动创建文件
dic = {'k1':'v1','k2':'v2','k3':'v3'}
json.dump(dic,f) #dump方法接收一个文件句柄，直接将字典转换成json字符串放入文件。
f.close()#关闭文件句柄

f = open('json_file')#打开文件
dic2 = json.load(f)#通过json.load将文件中的内容取出来，直接将文件中的json字符串转换成数据结构
f.close()#关闭文件句柄
print(type(dic2),dic2)

json格式化输出

import json
# json格式化输出
data = {'username':['李华','二愣子'],'sex':'male','age':16}
json_dic2 = json.dumps(data,sort_keys=True,indent=4,separators=(',',':'),ensure_ascii=False)

json 和 pickle模块

用于序列化的两个模块

　　json：用于字符串和python数据类型之间的转换。

　　pickle：用于python特有的类型和python的数据类型间进行转换。

pickle模块提供了四个功能：dumps，dump （序列化，存） loads（反序列化，读），load（不仅可以序列化字典，列表。。可以把python中任意的数据类型序列化）。

# import pickle
# dic = {'k1':'v1','k2':'v2','k3':'v3'}
# str_dic = pickle.dumps(dic)#编译成一段bytes类型的数据
# # print(str_dic)
# 
# dic2 = pickle.loads(str_dic)#解开bytes类型的字典。
# print(dic2)

import pickle
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = pickle.dumps(dic)
print(str_dic) #一串二进制内容

dic2 = pickle.loads(str_dic)
print(dic2) #字典

import time
struct_time = time.localtime(1000000000)
print(struct_time)
f = open('pickle_file','wb')
pickle.dump(struct_time,f)
f.close()

f = open('pickle_file','rb')
struct_time2 = pickle.load(f)
print(struct_time2.tm_year)

pickle

shelve

import shelve
f = shelve.open('shelve_file')
f['key'] = {'int':10, 'float':9.5, 'string':'Sample data'}  #直接对文件句柄操作，就可以存入数据
f.close()

import shelve
f1 = shelve.open('shelve_file')
existing = f1['key']  #取出数据的时候也只需要直接用key获取即可，但是如果key不存在会报错
f1.close()
print(existing)

shelve

这个模块有个限制，它不支持多个应用同一时间往同一个DB进行写操作。所以当我们知道我们的应用如果只进行读操作，我们可以让shelve通过只读方式打开DB

import shelve
f = shelve.open('shelve_file', flag='r')
existing = f['key']
f.close()
print(existing)

由于shelve在默认情况下是不会记录待持久化对象的任何修改的，所以我们在shelve.open()时候需要修改默认参数，否则对象的修改不会保存。

import shelve
f1 = shelve.open('shelve_file')
print(f1['key'])
f1['key']['new_value'] = 'this was not here before'
f1.close()

f2 = shelve.open('shelve_file', writeback=True)
print(f2['key'])
f2['key']['new_value'] = 'this was not here before'
f2.close()

writeback方式有优点也有缺点。优点是减少了我们出错的概率，并且让对象的持久化对用户更加的透明了；但这种方式并不是所有的情况下都需要，首先，使用writeback以后，shelf在open()的时候会增加额外的内存消耗，并且当DB在close()的时候会将缓存中的每一个对象都写入到DB，这也会带来额外的等待时间。因为shelve没有办法知道缓存中哪些对象修改了，哪些对象没有修改，因此所有的对象都会被写入。

20，序列化模块 json，pickle，shelve

猜你喜欢