当前位置: 开发笔记 > 编程语言 > 正文

开发笔记:python序列化复习

作者：Gefose-洋娃娃_357 | 来源：互联网 | 2023-10-12 16:31

篇首语：本文由编程笔记#小编为大家整理，主要介绍了python序列化-复习相关的知识，希望对你有一定的参考价值。序列化

篇首语：本文由编程笔记#小编为大家整理，主要介绍了python序列化-复习相关的知识，希望对你有一定的参考价值。

序列化

From https://www.liaoxuefeng.com/

在程序运行的过程中，所有的变量都是在内存中，比如，定义一个dict：

d = dict(name=‘Bob‘, age=20, score=88)

可以随时修改变量，比如把name改成‘Bill‘，但是一旦程序结束，变量所占用的内存就被操作系统全部回收。如果没有把修改后的‘Bill‘存储到磁盘上，下次重新运行程序，变量又被初始化为‘Bob‘。

我们把变量从内存中变成可存储或传输的过程称之为序列化，在Python中叫pickling，在其他语言中也被称之为serialization，marshalling，flattening等等，都是一个意思。

序列化之后，就可以把序列化后的内容写入磁盘，或者通过网络传输到别的机器上。

反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化，即unpickling。

Python提供两个模块来实现序列化：cPickle和pickle。这两个模块功能是一样的，区别在于cPickle是C语言写的，速度快，pickle是纯Python写的，速度慢，跟cStringIO和StringIO一个道理。用的时候，先尝试导入cPickle，如果失败，再导入pickle：

try: import cPickle as pickle except ImportError: import pickle

首先，我们尝试把一个对象序列化并写入文件：

>>> d = dict(name=‘Bob‘, age=20, score=88) >>> pickle.dumps(d) "(dp0\nS‘age‘\np1\nI20\nsS‘score‘\np2\nI88\nsS‘name‘\np3\nS‘Bob‘\np4\ns."

pickle.dumps()方法把任意对象序列化成一个str，然后，就可以把这个str写入文件。或者用另一个方法pickle.dump()直接把对象序列化后写入一个file-like Object：

>>> f = open(‘dump.txt‘, ‘wb‘) >>> pickle.dump(d, f) >>> f.close()

看看写入的dump.txt文件，一堆乱七八糟的内容，这些都是Python保存的对象内部信息。

当我们要把对象从磁盘读到内存时，可以先把内容读到一个str，然后用pickle.loads()方法反序列化出对象，也可以直接用pickle.load()方法从一个file-like Object中直接反序列化出对象。我们打开另一个Python命令行来反序列化刚才保存的对象：

>>> f = open(‘dump.txt‘, ‘rb‘) >>> d = pickle.load(f) >>> f.close() >>> d {‘age‘: 20, ‘score‘: 88, ‘name‘: ‘Bob‘}

变量的内容又回来了！

当然，这个变量和原来的变量是完全不相干的对象，它们只是内容相同而已。

Pickle的问题和所有其他编程语言特有的序列化问题一样，就是它只能用于Python，并且可能不同版本的Python彼此都不兼容，因此，只能用Pickle保存那些不重要的数据，不能成功地反序列化也没关系。

JSON

如果我们要在不同的编程语言之间传递对象，就必须把对象序列化为标准格式，比如XML，但更好的方法是序列化为JSON，因为JSON表示出来就是一个字符串，可以被所有语言读取，也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式，并且比XML更快，而且可以直接在Web页面中读取，非常方便。

JSON表示的对象就是标准的Javascript语言的对象，JSON和Python内置的数据类型对应如下：

JSON类型	Python类型
{}	dict
[]	list
"string"	‘str‘或u‘unicode‘
1234.56	int或float
true/false	True/False
null	None

Python内置的json模块提供了非常完善的Python对象到JSON格式的转换。我们先看看如何把Python对象变成一个JSON：

>>> import json >>> d = dict(name=‘Bob‘, age=20, score=88) >>> json.dumps(d) ‘{"age": 20, "score": 88, "name": "Bob"}‘

dumps()方法返回一个str，内容就是标准的JSON。类似的，dump()方法可以直接把JSON写入一个file-like Object。

要把JSON反序列化为Python对象，用loads()或者对应的load()方法，前者把JSON的字符串反序列化，后者从file-like Object中读取字符串并反序列化：

>>> json_str = ‘{"age": 20, "score": 88, "name": "Bob"}‘ >>> json.loads(json_str) {u‘age‘: 20, u‘score‘: 88, u‘name‘: u‘Bob‘}

有一点需要注意，就是反序列化得到的所有字符串对象默认都是unicode而不是str。由于JSON标准规定JSON编码是UTF-8，所以我们总是能正确地在Python的str或unicode与JSON的字符串之间转换。

JSON进阶

Python的dict对象可以直接序列化为JSON的{}，不过，很多时候，我们更喜欢用class表示对象，比如定义Student类，然后序列化：

import json class Student(object): def __init__(self, name, age, score): self.name = name self.age = age self.score = score s = Student(‘Bob‘, 20, 88) print(json.dumps(s))

运行代码，毫不留情地得到一个TypeError：

Traceback (most recent call last): ... TypeError: <__main__.Student object at 0x10aabef50> is not JSON serializable

错误的原因是Student对象不是一个可序列化为JSON的对象。

如果连class的实例对象都无法序列化为JSON，这肯定不合理！

别急，我们仔细看看dumps()方法的参数列表，可以发现，除了第一个必须的obj参数外，dumps()方法还提供了一大堆的可选参数：

https://docs.python.org/2/library/json.html#json.dumps

这些可选参数就是让我们来定制JSON序列化。前面的代码之所以无法把Student类实例序列化为JSON，是因为默认情况下，dumps()方法不知道如何将Student实例变为一个JSON的{}对象。

可选参数default就是把任意一个对象变成一个可序列为JSON的对象，我们只需要为Student专门写一个转换函数，再把函数传进去即可：

def student2dict(std): return { ‘name‘: std.name, ‘age‘: std.age, ‘score‘: std.score } print(json.dumps(s, default=student2dict))

这样，Student实例首先被student2dict()函数转换成dict，然后再被顺利序列化为JSON。

不过，下次如果遇到一个Teacher类的实例，照样无法序列化为JSON。我们可以偷个懒，把任意class的实例变为dict：

print(json.dumps(s, default=lambda obj: obj.__dict__))

因为通常class的实例都有一个__dict__属性，它就是一个dict，用来存储实例变量。也有少数例外，比如定义了__slots__的class。

同样的道理，如果我们要把JSON反序列化为一个Student对象实例，loads()方法首先转换出一个dict对象，然后，我们传入的object_hook函数负责把dict转换为Student实例：

def dict2student(d): return Student(d[‘name‘], d[‘age‘], d[‘score‘]) json_str = ‘{"age": 20, "score": 88, "name": "Bob"}‘ print(json.loads(json_str, object_hook=dict2student))

运行结果如下：

<__main__.Student object at 0x10cd3c190>

打印出的是反序列化的Student实例对象。

小结

Python语言特定的序列化模块是pickle，但如果要把序列化搞得更通用、更符合Web标准，就可以使用json模块。

json模块的dumps()和loads()函数是定义得非常好的接口的典范。当我们使用时，只需要传入一个必须的参数。但是，当默认的序列化或反序列机制不满足我们的要求时，我们又可以传入更多的参数来定制序列化或反序列化的规则，既做到了接口简单易用，又做到了充分的扩展性和灵活性。

推荐阅读

hash
手把手教你构建简易JSON解析器

本文将带你深入了解JSON解析器的构建过程，通过实践掌握JSON解析的基本原理。适合所有对数据解析感兴趣的开发者。 ... [详细]

蜡笔小新 2024-12-03 10:07:48
byte
在Android中编写和读取.JSON文件

本文探讨了在Android平台下编写和读取.JSON文件的方法，解决读取文件时遇到的字符间异常空格问题。 ... [详细]

蜡笔小新 2024-12-01 14:37:18
heap
Shiro功能拓展：登录失败重试次数限制

本文详细介绍了如何在Apache Shiro框架中实现对用户登录失败重试次数的限制，通过自定义密码匹配器来增强系统的安全性。该方法不仅能够有效防止暴力破解攻击，还能确保合法用户的账户安全。 ... [详细]

蜡笔小新 2024-12-03 21:39:23
version
深入了解企业开发框架：NHibernate与Spring.NET

本文深入探讨了企业级开发框架NHibernate和Spring.NET的关键特性之一——面向方面编程（AOP）。文章不仅介绍了AOP的基本概念及其如何增强面向对象编程（OOP），还详细说明了Spring.NET中AOP的具体应用，包括事务管理和自定义方面的实现。 ... [详细]

蜡笔小新 2024-12-03 12:22:52
io
Java注解详解与应用

本文深入探讨了Java注解的基本概念及其在现代Java开发中的应用。文章不仅介绍了如何创建和使用自定义注解，还详细讲解了如何利用反射机制解析注解，以及Java内建注解的使用场景。 ... [详细]

蜡笔小新 2024-12-03 10:02:34
byte
Zsh 开发指南（第三篇字符串处理之转义字符和格式化输出）

导读上一篇讲了zsh的常用字符串操作，这篇开始讲更为琐碎的转义字符和格式化输出相关内容。包括转义字符、引号、print、printf的使用等等。其中很多内容没有必要记忆，作为手册参 ... [详细]

蜡笔小新 2024-12-03 03:30:40
version
databasesync适配openGauss使用指导书

一、database-sync简介database-sync作为一种开源辅助工具，用于数据库之间的表同步，更确切的说法是复制，可以从一个数据库复制表到另一个数据库该工具支持的功能如 ... [详细]

蜡笔小新 2024-12-02 18:31:18
version
从JSON数据中提取产品标题的方法

本文介绍了如何从给定的JSON响应中正确地提取产品标题等信息。 ... [详细]

蜡笔小新 2024-12-01 17:28:29
settings
初探Robot Framework自动化测试框架

本文档详细介绍了Robot Framework的基础知识、安装配置方法及其实用技巧。从环境搭建到编写第一个测试用例，涵盖了一系列实用的操作指南和最佳实践。 ... [详细]

蜡笔小新 2024-12-03 20:47:57
io
利用VBA与FSO对象提取文件夹内文件名并生成超链接至Excel

本文通过一个实际案例，详细介绍了如何使用Excel VBA和FSO（FileSystemObject）对象来提取指定文件夹中的所有文件名称，并将其以超链接的形式添加到Excel表格中。 ... [详细]

蜡笔小新 2024-12-03 19:52:45
version
利用 Linux 构建高效网络路由器

本文介绍了如何在 Linux 系统上构建网络路由器，特别关注于使用 Zebra 软件实现动态路由功能。通过具体的案例，展示了如何配置 RIP 和 OSPF 协议，以及如何利用多路由器查看工具（MRLG）监控网络状态。 ... [详细]

蜡笔小新 2024-12-03 17:33:54
version
设计模式笔记12：迭代器模式（Iterator Pattern）

设计模式笔记12：迭代器模式（Iterator Pattern） ... [详细]

蜡笔小新 2024-12-02 12:56:10
version
NHibernate会话工厂管理器详解

本文介绍了NHibernate中通过定义接口和实现类来管理会话工厂的方法，包括接口的优势、模型文件夹的结构以及具体的代码示例。 ... [详细]

蜡笔小新 2024-12-02 12:53:12
install
Inno Setup安装卸载时检查程序是否运行提示并中止程序

InnoSetup打包的软件需要在安装和卸载时检查程序是否在运行，不然会安装失败或者卸载不完全，网上搜了一下，有几种方法： ... [详细]

蜡笔小新 2024-12-02 12:07:45
io
深入理解Hibernate延迟加载机制

本文探讨了Hibernate框架中的延迟加载（懒加载）特性，分析其对程序性能的影响及实现原理，同时提供了具体的代码示例来说明如何配置和使用延迟加载。 ... [详细]

蜡笔小新 2024-12-02 11:53:44

Gefose-洋娃娃_357

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章