编程技巧:深入理解Python中的集合Set
作者:鬼王守护灵 | 来源:互联网 | 2024-12-11 17:53
本文详细介绍了Python编程语言中的集合(Set)数据类型,包括其基本概念、定义方法、常用操作以及应用场景,旨在帮助开发者更好地理解和利用这一高效的数据结构。
### 引言 本文旨在探讨Python中的集合(Set)数据类型,涵盖其定义、特性及实际应用,帮助读者深入了解这一数据结构。 #### 1. 集合的基本概念 集合是一种无序且不重复的数据结构,主要用于存储唯一元素。它支持数学中的集合运算,如交集、并集、差集等。 - **用途** - **去重**:自动去除重复元素,确保集合中的每个元素都是唯一的。 - **关系运算**:通过集合运算可以方便地进行数据比较和处理。 - **定义方式** - 使用花括号 `{}` 定义集合,元素之间用逗号 `,` 分隔。 - 示例:`s = {123, 333, 4444, 555}` - 特点: - 元素必须是不可变类型,如数字、字符串或元组。 - 集合内的元素不能重复。 - 集合内的元素无序,即不保持插入顺序。 - **示例** ```python s = {123, 123, 123, 123, 333, 4444, 555} print(s) # 输出:{123, 333, 4444, 555} ``` #### 2. 集合的基本操作 ##### 2.1 数据类型转换 - 将其他数据类型转换为集合。 ```python s = set('hello') print(s) # 输出:{'h', 'e', 'l', 'o'} ``` - 注意:不能将可变类型(如列表中的列表)直接转换为集合。 ```python print(set([11, 11, 11, 22, [33, 44]])) # 报错:无法将可变类型放入集合 ``` ##### 2.2 去重 - 从列表中去除重复项。 ```python infos = [ {'name': 'sean', 'age': 18, 'sex': 'male'}, {'name': 'jack', 'age': 73, 'sex': 'male'}, {'name': 'tom', 'age': 20, 'sex': 'female'}, {'name': 'egon', 'age': 18, 'sex': 'male'}, {'name': 'egon', 'age': 18, 'sex': 'male'}, ] l = [] for info in infos: if info not in l: l.append(info) print(l) ``` - 注意:字典本身是不可哈希的,因此不能直接放入集合中。 ```python print(set(infos)) # 报错:unhashable type: 'dict' ``` ##### 2.3 关系运算 ###### 2.3.1 交集 - 计算两个集合的交集。 ```python python_stus = ['张三', 'sean', 'jack', 'lili', '李四'] linux_stus = ['李大炮', '李二炮', 'jack', 'lili', '王三炮'] res = set(python_stus) & set(linux_stus) print(res) # 输出:{'jack', 'lili'} ``` - 使用 `intersection` 方法。 ```python res = set(python_stus).intersection(linux_stus) print(res) # 输出:{'jack', 'lili'} ``` ###### 2.3.2 并集 - 计算两个集合的并集。 ```python res = set(python_stus) | set(linux_stus) print(res) # 输出:{'张三', 'sean', 'jack', 'lili', '李四', '李大炮', '李二炮', '王三炮'} ``` - 使用 `union` 方法。 ```python res = set(python_stus).union(linux_stus) print(res) # 输出:{'张三', 'sean', 'jack', 'lili', '李四', '李大炮', '李二炮', '王三炮'} ``` ###### 2.3.3 差集 - 计算一个集合相对于另一个集合的差集。 ```python res = set(python_stus) - set(linux_stus) print(res) # 输出:{'张三', 'sean', '李四'} ``` - 使用 `difference` 方法。 ```python res = set(python_stus).difference(linux_stus) print(res) # 输出:{'张三', 'sean', '李四'} ``` ###### 2.3.4 对称差集 - 计算两个集合的对称差集。 ```python res = set(python_stus) ^ set(linux_stus) print(res) # 输出:{'张三', 'sean', '李四', '李大炮', '李二炮', '王三炮'} ``` - 使用 `symmetric_difference` 方法。 ```python res = set(python_stus).symmetric_difference(linux_stus) print(res) # 输出:{'张三', 'sean', '李四', '李大炮', '李二炮', '王三炮'} ``` ###### 2.3.5 父子集关系 - 判断一个集合是否是另一个集合的子集或父集。 ```python s1 = {1, 2, 3} s2 = {1, 2} print(s1.issuperset(s2)) # 输出:True print(s2.issubset(s1)) # 输出:True ``` ### 结论 集合是Python中非常有用的数据类型,适用于需要处理唯一元素和进行集合运算的场景。通过本文的介绍,希望能帮助读者更好地理解和使用集合。
推荐阅读
本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ...
[详细]
蜡笔小新 2024-12-27 10:18:13
1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ...
[详细]
蜡笔小新 2024-12-27 18:36:54
nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ...
[详细]
蜡笔小新 2024-12-28 13:00:24
本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ...
[详细]
蜡笔小新 2024-12-28 10:36:30
本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ...
[详细]
蜡笔小新 2024-12-28 09:46:23
Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ...
[详细]
蜡笔小新 2024-12-28 09:44:49
本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ...
[详细]
蜡笔小新 2024-12-28 08:39:55
本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ...
[详细]
蜡笔小新 2024-12-28 04:11:47
本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ...
[详细]
蜡笔小新 2024-12-27 19:31:05
本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ...
[详细]
蜡笔小新 2024-12-27 17:31:41
本文介绍如何利用Python实现从特定网站下载Word文档,去除水印并添加自定义水印,最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ...
[详细]
蜡笔小新 2024-12-27 13:10:20
本文详细介绍了 Java 中的 IO 流,包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据,并结合编码机制确保字符数据的正确读写。同时,文中还涵盖了装饰设计模式的应用,以及多种常见的 IO 操作实例。 ...
[详细]
蜡笔小新 2024-12-26 17:37:25
本文深入探讨了MySQL中的索引机制,包括索引的基本概念、优势与劣势、分类及其实现原理,并详细介绍了索引的使用场景和优化技巧。通过具体示例,帮助读者更好地理解和应用索引以提升数据库性能。 ...
[详细]
蜡笔小新 2024-12-25 19:52:47
本文基于刘洪波老师的《英文词根词缀精讲》,深入探讨了多个重要词根词缀的起源及其相关词汇,帮助读者更好地理解和记忆英语单词。 ...
[详细]
蜡笔小新 2024-12-27 18:59:50
题目描述:给定n个半开区间[a, b),要求使用两个互不重叠的记录器,求最多可以记录多少个区间。解决方案采用贪心算法,通过排序和遍历实现最优解。 ...
[详细]
蜡笔小新 2024-12-27 18:14:31