当前位置: 开发笔记 > 编程语言 > 正文

【Python】详解可变/不可变对象与深/浅拷贝

作者：顺佳海外 | 来源：互联网 | 2023-09-24 11:47

目录一、绪论二、说明2.1赋值(Assignment)2.1.1变量与对象(VariablesandObjects)2.1.2不可变对象(ImmutableObjects

一、绪论

二、说明

2.1 赋值 (Assignment)

2.1.1 变量与对象 (Variables and Objects)

2.1.2 不可变对象 (Immutable Objects)

2.1.3 可变对象 (Mutable Objects)

2.1.4 直接赋值 (Direct Assignment)

2.2 copy.copy() —— 浅拷贝 (Shallow Copy)

2.3 copy.deepcopy() —— 深拷贝 (Deep Copy)

2.4 其他 (Others)

一、绪论
copy 模块定义了对象拷贝相关方法。有别于使用等号 “&＃61;” 赋值的操作&＃xff0c;copy 模块能够实现对数据对象的深、浅拷贝&＃xff1a;
名称功能
copy() 返回数据对象的浅拷贝
deepcopy() 返回数据对象的深拷贝
以下将结合 Python 等号赋值对比说明深、浅拷贝的作用和意义。但此前&＃xff0c;须先理清可变对象 & 不可变对象的含义与联系。

二、说明

2.1 赋值 (Assignment)

2.1.1 变量与对象 (Variables and Objects)

对象指的是内存中存储数据的实体&＃xff0c;具有明确的类型&＃xff0c;在 Python 中一切都是对象&＃xff0c;包括函数。

变量作为对象的 引用/别名&＃xff0c;实质保存着所指对象的 内存地址。

知识点&＃xff1a;

Python 是一门 动态 (dynamic) 强类型 (strong) 语言。动态类型语言即 在运行期间才确定数据类型。例如&＃xff0c;Vbscript 和 Python 是动态类型的&＃xff0c;因为它们是 在赋值时确定变量的类型。相反&＃xff0c;静态类型语言 在编译期间就确定数据类型&＃xff0c;这类语言大都通过要求 在使用任一变量前声明其数据类型 来确保类型固定&＃xff0c;例如 Java 和 C。

>>> x &＃61; 666 # 666 是一个对象, 而 x 是指向对象 666 的一个变量, 类型相应为 int 型 >>> x 666## 变量 x 可以指向任意对象, 而没有类型的前提限制, 因为动态语言变量类型可随着赋值而动态改变>>> x &＃61; &＃39;666&＃39; # 变量 x 指向新的对象 &＃39;666&＃39;, 类型随之变为 string 型 >>> x &＃39;666&＃39;

总之&＃xff0c;在 Python 中&＃xff0c;类型属于对象&＃xff0c;变量本无类型&＃xff0c;仅仅是一个对对象的引用。而变量指向对象的数据类型若发生变化&＃xff0c;则变量的类型亦随之改变。而赋值语句改变的是变量所执的对对象的引用&＃xff0c;故一个变量可指向各种数据类型的对象。

此外&＃xff0c;在 Python 中&＃xff0c;从数据类型的角度看&＃xff0c;对象可分为 “可变对象” 和 “不可变对象”&＃xff0c;常见的内建类型有&＃xff1a;

2.1.2 不可变对象 (Immutable Objects)

不可变对象&＃xff1a;对象相应内存中的值 不可改变&＃xff0c;常见的有 int、float、string、tuple 等类型的对象。因为 Python 中的变量存放的是 对象引用&＃xff0c;所以对不可变对象而言&＃xff0c;尽管对象本身不可改变&＃xff0c;但 变量对对象的引用或指向关系仍是可变的。具体而言&＃xff0c;指向原不可变对象的变量被改变为指向新对象时&＃xff0c;Python 会开辟一块新的内存区域&＃xff0c;并令变量指向这个新内存 (存放新对象引用)&＃xff0c;因此 变量对对象的引用或指向关系是灵活的、可变的。例如&＃xff1a;

i &＃61; 73 # 变量 i 指向原不可变对象 73 (变量 i 存放原对象 73 的引用) i &＃43;&＃61; 2 # 变量 i 指向新对象 75 (变量 i 存放原对象 75 的引用)

综上可知&＃xff0c;不可变对象自身并未改变&＃xff0c;而是创建了新不可变对象&＃xff0c;改变了变量的对象引用。具体而言&＃xff0c;原不可变对象 73 内存中的值并未改变&＃xff0c;Python 创建了新不可变对象 75&＃xff0c;并令变量 i 重新指向新不可变对象 75 / 保存对新对象 75 的引用&＃xff0c;并通过 “垃圾回收机制” 回收原对象 73 的内存。

知识点&＃xff1a;

垃圾回收 (garbage collection) 机制指&＃xff1a;对处理完毕后不再需要的堆内存空间的数据对象 (“垃圾”) 进行清理&＃xff0c;释放它们所使用的内存空间的过程。例如&＃xff0c;C 使用 free() 函数&＃xff1b;C&＃43;&＃43; 使用 delete 运算符&＃xff1b;而在 C&＃43;&＃43; 基础上开发的 C# 和 Java 等&＃xff0c;其程序运行环境会自动进行垃圾回收&＃xff0c;以避免用户疏忽而忘记释放内存&＃xff0c;造成 内存泄露 (memory leaky) 问题。
Python 通过 引用计数 (Reference Counting) 和一个 能够检测和打破循环引用的循环垃圾回收器 来执行垃圾回收。可用 gc 模块控制垃圾回收器。具体而言&＃xff0c;对每个对象维护一个 ob_refcnt 字段 (对象引用计数器)&＃xff0c;用于记录该对象当前被引用的次数。每当有新引用指向该对象时&＃xff0c;该对象的引用计数 ob_refcnt &＃43;1&＃xff1b;每当该对象的引用失效时&＃xff0c;该对象的引用计数 ob_refcnt -1&＃xff1b;一旦对象的引用计数 ob_refcnt &＃61; 0&＃xff0c;该对象立即被回收&＃xff0c;对象占用的内存空间将被自动放入 自由内存空间池&＃xff0c;以待后用。
这种引用计数垃圾回收机制的优点在于&＃xff0c;能够自动清理不用的内存空间&＃xff0c;甚至能够随意新建对象引用 (不建议) 而无需考虑手动释放内存空间的问题&＃xff0c;故相比于 C 或 C&＃43;&＃43; 这类静态语言更“省心”。
这种引用计数垃圾回收机制的 次要缺点 是需要额外空间资源维护引用计数&＃xff0c;主要缺点则是无法解决对象的“循环引用”问题。因此&＃xff0c;也有很多语言如 Java 并未采用该机制。

注意&＃xff0c;对于不可变对象&＃xff0c;所有指向该对象的变量在内存中 共用同一个地址。这种多个变量引用同一个对象的现象叫做 共享引用。但不管有多少个引用指向它&＃xff0c;都只有一个地址值&＃xff0c;只有一个引用计数会记录指向该地址的引用数目。

>>> x &＃61; 0 >>> y &＃61; 0 >>> print(id(x) &＃61;&＃61; id(y)) True >>> print(x is y) True >>> print(id(0), id(x), id(y)) # 结果不唯一, 但一定是相同的 2424416677616 2424416677616 2424416677616

事实上&＃xff0c;Python 对不可变对象有着许多性能/效率优化机制&＃xff0c;若学有余力或饶有兴趣&＃xff0c;不妨了解一下以加深对内存优化机制的理解&＃xff0c;详见文章《【Python】详解小整数池 & intern 机制 (不可变对象的内存优化原理) 》。

2.1.3 可变对象 (Mutable Objects)

可变对象&＃xff1a;变量所指向对象的内存地址处的值 可改变&＃xff0c;常见的有 list、set、dict 等类型的对象。因此指向可变对象的变量若发生改变&＃xff0c;则该可变对象亦随之改变&＃xff0c;即发生 原地 (in-place) 修改。另一方面&＃xff0c; 当可变对象相应内存中的值变化时&＃xff0c;变量的对可变对象引用仍保持不变&＃xff0c;即变量仍指向原可变对象。例如&＃xff1a;

>>> m &＃61; [5, 9] # 变量 m 指向可变对象 (list) >>> id(m) 1841032547080>>> m &＃43;&＃61; [6] # 可变对象 (list) 将随变量 m 的改变而发生原地 (in-place) 修改, 但 m 仍是其引用 (保存的内存地址 id 不变) >>> id(m) 1841032547080

综上可知&＃xff0c;可变对象随着变量的改变而改变&＃xff0c;但变量对可变对象的引用关系仍保持不变&＃xff0c;即变量仍指向原可变对象。例如&＃xff0c;变量 m 先指向可变对象 [5, 9] &＃xff0c;然后随着变量增加元素 6&＃xff0c;可变对象 [5, 9] 也随之在内存中增加 6&＃xff0c;而变化前、后变量 m 始终指向同一个可变对象 / 保存对同一可变对象的引用。

但注意&＃xff0c;我们也由此知道&＃xff0c;对于 “看起来相同” 的可变对象&＃xff0c;其内存地址是完全不同的&＃xff0c;例如&＃xff1a;

>>> n &＃61; [1, 2, 3] >>> id(n) 1683653539464>>> n &＃61; [1, 2, 3] >>> id(n) 1683653609928

可见&＃xff0c;对于两个可变对象 [1, 2, 3]&＃xff0c;二者是先后分别创建的新可变对象&＃xff0c;虽然值相同&＃xff0c;但内存地址完全不同。而这点有别于不可变对象&＃xff0c;因为 所有指向不可变对象的变量在内存中共用同一个地址 (比如 2.1.2 中 666 的例子)。

2.1.4 直接赋值 (Direct Assignment)

Python 中的变量存在 深拷贝 和 浅拷贝 的区别&＃xff1a;

对于不可变对象&＃xff0c;无论深、浅拷贝&＃xff0c;内存地址 (id) 都是一成不变的&＃xff1b;
对于可变对象&＃xff0c;则存在 3 种不同情况。

以下以 list 为例简要说明 可变对象的 3 种情况&＃xff1a;

情况一 - 直接赋值&＃xff1a;仅拷贝了对可变对象的引用&＃xff0c;故前后变量均未隔离&＃xff0c;任一变量 / 对象改变&＃xff0c;则所有引用了同一可变对象的变量都作相同改变。例如&＃xff1a;

>>> x &＃61; [555, 666, [555, 666]] >>> y &＃61; x # 直接赋值, 变量前后并未隔离 >>> y [555, 666, [555, 666]]# 修改变量 x, 变量 y 也随之改变 >>> x.append(777) >>> x [555, 666, [555, 666], 777] >>> y [555, 666, [555, 666], 777]# 修改变量 y, 变量 x 也随之改变 >>> y.pop() 777 >>> y [555, 666, [555, 666]] >>> x [555, 666, [555, 666]]

在某些情况下&＃xff0c;这是致命的&＃xff0c;因此还需要深、浅拷贝来正确实现真正所需的拷贝目的。

2.2 copy.copy() —— 浅拷贝 (Shallow Copy)

情况二 - 浅拷贝&＃xff1a;使用 copy(x) 函数&＃xff0c;拷贝可变对象如 list 的最外层对象并实现隔离&＃xff0c;但 list 内部的嵌套对象仍是未被隔离的引用关系。例如&＃xff1a;

>>> import copy >>> x &＃61; [555, 666, [555, 666]] >>> z &＃61; copy.copy(x) # 浅拷贝 >>> zz &＃61; x[:] # 也是浅拷贝, 等同于使用 copy() 函数的 z >>> z [555, 666, [555, 666]] >>> zz [555, 666, [555, 666]]# 改变变量 x 的外围元素, 不会改变浅拷贝变量 >>> x.append(777) >>> x [555, 666, [555, 666], 777] # 只有自身改变, 增加了外围元素 777 >>> z [555, 666, [555, 666]] # 未改变 >>> zz [555, 666, [555, 666]] # 未改变# 改变变量 x 的内层元素, 则会改变浅拷贝变量 >>> x[2].append(888) >>> x [555, 666, [555, 666, 888], 777] # 同时发生改变, 增加了内层元素 888 >>> z [555, 666, [555, 666, 888]] # 同时发生改变, 增加了内层元素 888 >>> zz [555, 666, [555, 666, 888]] # 同时发生改变, 增加了内层元素 888# 浅拷贝变量的外围元素改变不会相互影响 >>> z.pop(0) 555 >>> x [555, 666, [555, 666, 888], 777] # 未改变 >>> z [666, [555, 666, 888]] # 只有自身改变, 弹出了外围元素 555 >>> zz [555, 666, [555, 666, 888]] # 未改变# 浅拷贝变量的内层元素改变会相互影响 >>> z[1].pop() 888 >>> x [555, 666, [555, 666], 777] # 同时发生改变, 弹出了内层元素 888 >>> z [666, [555, 666]] # 同时发生改变, 弹出了内层元素 888 >>> zz [555, 666, [555, 666]] # 同时发生改变, 弹出了内层元素 888

注意&＃xff0c;所谓改变应包含 “增、删、改” 三种&＃xff0c;以上仅展示了前两种情况&＃xff0c;第三种不言自明。

此外&＃xff0c;若有人问元组 (tuple) 一定是不可变的吗&＃xff1f;答案是不一定&＃xff0c;因为浅拷贝时仅隔离最外层对象&＃xff0c;而内层嵌套对象则仍为引用关系&＃xff0c;例如&＃xff1a;

>>> t &＃61; (1, 2, [3, 4]) # tuple >>> import copy >>> ct &＃61; copy.copy(t) # 浅拷贝 tuple # 注意, 令 ct &＃61; t 时此例结果仍然相同 >>> ct (1, 2, [3, 4]) >>> ct[2][-1] &＃61; 5 # 修改 ct >>> ct (1, 2, [3, 5]) >>> t # t 也随之改变, 证明内层嵌套对象仍为引用关系 (1, 2, [3, 5])

2.3 copy.deepcopy() —— 深拷贝 (Deep Copy)

情况三 - 深拷贝&＃xff1a;使用 deepcopy(x[,memo]) 函数&＃xff0c;拷贝可变对象如 list 的“外围&＃43;内层”而非引用&＃xff0c;实现对前后变量不论深浅层的完全隔离。例如&＃xff1a;

>>> import copy >>> x &＃61; [555, 666, [555, 666]] >>> k &＃61; copy.deepcopy(x) # 深拷贝 >>> k [555, 666, [555, 666]]# 改变变量 x 的外围元素, 不会改变深拷贝变量 >>> x.append(777) >>> x [555, 666, [555, 666], 777] >>> k [555, 666, [555, 666]] # 未改变# 改变变量 x 的内层元素, 同样不会改变深拷贝变量 >>> x[2].append(888) >>> x [555, 666, [555, 666, 888], 777] >>> k [555, 666, [555, 666]] # 未改变# 深拷贝变量的外围元素改变不会相互影响 >>> k.pop(0) 555 >>> x [555, 666, [555, 666, 888], 777] # 未改变 >>> k [666, [555, 666]]# 深拷贝变量的内层元素改变同样不会相互影响 >>> k[1].pop() 666 >>> x [555, 666, [555, 666, 888], 777] # 未改变 >>> k [666, [555]]

再次试验元组 (tuple) 的例子以展示浅拷贝和深拷贝的区别于联系&＃xff1a;

>>> t &＃61; (1, 2, [3, 4]) # tuple >>> import copy >>> ct &＃61; copy.deepcopy(t) # 深拷贝 tuple >>> ct (1, 2, [3, 4]) >>> ct[2][-1] &＃61; 5 # ct 改变 >>> ct (1, 2, [3, 5]) >>> t # t 不论外层还是内层嵌套变量, 均不变 (完全隔离) (1, 2, [3, 4])

2.4 其他 (Others)

上述内容即为基本用法&＃xff0c;对于普通使用足够了。若想进一步深入&＃xff0c;可选读如下内容&＃xff1a;

浅拷贝和深拷贝之间的区别仅在于 复合对象 (即包含其他对象的对象&＃xff0c;如 list 或类的实例) 相关&＃xff1a;

一个 浅拷贝 会构造一个新的复合对象&＃xff0c;然后 (在可能的范围内) 将原对象中找到的引用插入其中。

一个 深拷贝 会构造一个新的复合对象&＃xff0c;然后递归地将原始对象中所找到的对象的副本插入。

深拷贝操作通常存在两个问题&＃xff0c;而浅拷贝操作并不存在这些问题&＃xff1a;

递归对象 (直接或间接包含对自身引用的复合对象) 可能会导致 递归循环。

由于深拷贝会复制所有内容 (外围内层)&＃xff0c;故可能 过多复制 (例如本应在副本间共享的数据) 。

深拷贝函数 deepcopy() 通过以下方式避免上述问题&＃xff1a;

保留在当前复制过程中已复制的对象的 “备忘录” (memo) 字典&＃xff1b;

允许用户定义的类重载复制操作或复制的组件集合。

此外&＃xff0c;copy 模块不拷贝模块、方法、栈追踪&＃xff08;stack trace&＃xff09;、栈帧&＃xff08;stack frame&＃xff09;、文件、套接字、窗口、数组及任何类似的类型。它通过不改变地返回原始对象来&＃xff08;浅层或深层地&＃xff09;“复制” 函数和类&＃xff1b;类似于 pickle 模块处理这类问题的方式。

参考资料&＃xff1a;

Python可变对象和不可变对象

8.10. copy — 浅层 (shallow) 和深层 (deep) 复制操作 — Python 3.6.15 文档

Python中的垃圾回收机制&＃xff08;转&＃xff09; - 奋斗终生 - 博客园

推荐阅读

express
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
express
C语言编写线程池的简单实现方法

2019独角兽企业重金招聘Python工程师标准好文章，一起分享——有时我们会需要大量线程来处理一些相互独立的任务，为了避免频繁的申请释放线程所带 ... [详细]

蜡笔小新 2024-11-14 20:11:23
rsa
普通树(每个节点可以有任意数量的子节点)级序遍历

普通树(每个节点可以有任意数量的子节点)级序遍历 ... [详细]

蜡笔小新 2024-11-14 18:53:26
rsa
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
input
C#实现文件的压缩与解压

2019独角兽企业重金招聘Python工程师标准一、准备工作1、下载ICSharpCode.SharpZipLib.dll文件2、项目中引用这个dll二、文件压缩与解压共用类 ... [详细]

蜡笔小新 2024-11-14 10:37:34
import
Spring Data JdbcTemplate 入门指南

本文将介绍如何使用 Spring JdbcTemplate 进行数据库操作，包括查询和插入数据。我们将通过一个学生表的示例来演示具体步骤。 ... [详细]

蜡笔小新 2024-11-14 10:33:29
input
字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流

字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ... [详细]

蜡笔小新 2024-11-12 14:07:25
import
iOS 不定参数详解

iOS 不定参数详解 ... [详细]

蜡笔小新 2024-11-14 17:12:05
filter
Spark 弹性分布式数据集详解

本文详细介绍了 Spark 中的弹性分布式数据集（RDD）及其常见的操作方法，包括 union、intersection、cartesian、subtract、join、cogroup 等转换操作，以及 count、collect、reduce、take、foreach、first、saveAsTextFile 等行动操作。 ... [详细]

蜡笔小新 2024-11-14 15:44:57
filter
如何在文件中存储和读取字典对象

本文介绍了如何将包含复杂对象的字典保存到文件，并从文件中读取这些字典。 ... [详细]

蜡笔小新 2024-11-14 15:20:48
fetch
包含phppdoerrorcode的词条

包含phppdoerrorcode的词条 ... [详细]

蜡笔小新 2024-11-14 12:06:14
default
机器学习算法：SVM（支持向量机）

SVM算法（SupportVectorMachine，支持向量机）的核心思想有2点：1、如果数据线性可分，那么基于最大间隔的方式来确定超平面，以确保全局最优， ... [详细]

蜡笔小新 2024-11-14 04:33:58
default
JVM钩子函数的应用场景详解

本文详细介绍了JVM钩子函数的多种应用场景，包括正常关闭、异常关闭和强制关闭。通过具体示例和代码演示，帮助读者更好地理解和应用这一机制。适合对Java编程和JVM有一定基础的开发者阅读。 ... [详细]

蜡笔小新 2024-11-13 18:34:48
filter
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
import
Java反射机制详解及应用场景

本文详细介绍了Java反射机制的基本概念、获取Class对象的方法、反射的主要功能及其在实际开发中的应用。通过具体示例，帮助读者更好地理解和使用Java反射。 ... [详细]

蜡笔小新 2024-11-13 16:08:08

顺佳海外

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

名称	功能
copy()	返回数据对象的浅拷贝
deepcopy()	返回数据对象的深拷贝