《FluentPython》学习笔记：第1章Python数据模型

作者：Steven | 来源：互联网 | 2023-07-02 09:09

Python最好的品质之一是一致性。len(colleciton)而不是collection.len()写法所代表的庞大的设计思想，是形成我们通常说的“Python

Python最好的品质之一是一致性。

len(colleciton)而不是collection.len()写法所代表的庞大的设计思想&＃xff0c;是形成我们通常说的“Python风格”&＃xff08;Pythonic&＃xff09;的关键。

特殊方法

特殊方法的名字以两个下划线开头&＃xff0c;以两个下划线结尾&＃xff08;例如__getitem__&＃xff09;。
比如obj[key]的背后就是__getitem__方法&＃xff0c;为了能求得my_collection[key]的值&＃xff0c;解释器实际上会调用my_collection.__getitem__(key)。
魔术方法&＃xff08;magic method&＃xff09;是特殊方法的昵称。

1.1 一摞Python风格的纸牌

import collectionsCard &＃61; collections.namedtuple(&＃39;Card&＃39;, [&＃39;rank&＃39;, &＃39;suit&＃39;]) # 等号前后的Card可不一致&＃xff0c;一致是为避免混淆class FrenchDeck: # 一套扑克牌&＃xff0c;不含大小王ranks &＃61; [str(n) for n in range(2, 11)] &＃43; list(&＃39;JQKA&＃39;)suits &＃61; &＃39;spades diamonds clubs hearts&＃39;.split()def __init__(self):self._cards &＃61; [Card(rank, suit) for suit in self.suits for rank in self.ranks]def __len__(self):return len(self._cards)def __getitem__(self, position):return self._cards[position]

getitem

实现__getitem__方法后&＃xff0c;该对象即可iterable&＃xff0c;可以被当作可迭代的对象使用&＃xff0c;具体的可迭代类型&＃xff0c;看该方法的返回值
可以使用位置索引 [n]来访问序列中的值&＃xff0c;另外&＃xff0c;因为 __getitem__方法把[]操作交给了 self._cards列表&＃xff0c;所以自动支持切片操作。
对象可迭代&＃xff0c;如可以用 for i in obj迭代。当调用 for i in obj时&＃xff0c;其实用的是 iter(obj)&＃xff0c;调用的 __iter__方法。但是如过没有实现 __iter__方法&＃xff0c;那么它会令 position从 0开始递增&＃xff0c;直到触发 IndexError结束&＃xff0c;且只能是 IndexError类型的 Error&＃xff0c;否则触发错误后会引发异常。
可以用in运算符&＃xff08;即使没实现 __contains__&＃xff0c;它会按顺序做一次迭代搜索&＃xff09;
可以用random.choice()方法来随机获取一个元素&＃xff08;用这个方法还需要额外实现 __len__&＃xff09;

namedtuple

出处&＃xff1a;Python标准库collections
生成了一个class&＃xff0c;用于构建只有少数属性但是没有方法的对象&＃xff0c;比如数据库条目。它相当于于下面的代码&＃xff0c;但有且只能有属性rank和suit&＃xff0c;无法再动态绑定任何新的属性和方法了&＃xff08;元组无法修改&＃xff09;。这使得原始数据的含义依然能被保留&＃xff0c;增加可读性和便捷性。

class Card:def __init__(self, rank, suit):self.rank &＃61; rankself.suit &＃61; suit

语法&＃xff1a;
collections.namedtuple(typename, field_names, *, verbose&＃61;False, rename&＃61;False, module&＃61;None)

typename&＃xff1a;实际上就是你通过namedtuple创建的一个元组的子类的类名&＃xff0c;通过这样的方式我们可以初始化各种各样的实例化元组对象。
field_names&＃xff1a;类似于字典的key&＃xff0c;在这里定义的元组可以通过这样的key去获取里面对应索引位置的元素值&＃xff0c;这样的key可以是列表&＃xff0c;也可以是用空格、/和逗号这样的分隔符隔开的字符串。
rename&＃xff1a;如果rename指定为True&＃xff0c;那么你的field_names里面不能包含有非Python标识符&＃xff0c;Python中的关键字以及重复的name&＃xff0c;如果有&＃xff0c;它会默认给你重命名成‘_index’的样式&＃xff0c;这个index表示该name在field_names中的索引&＃xff0c;例&＃xff1a;[&＃39;abc&＃39;, &＃39;def&＃39;, &＃39;ghi&＃39;, &＃39;abc&＃39;]将被转换成[&＃39;abc&＃39;, &＃39;_1&＃39;, &＃39;ghi&＃39;, &＃39;_3&＃39;]。

# Basic example of namedtuple Point &＃61; collections.namedtuple(&＃39;Point&＃39;, [&＃39;x&＃39;, &＃39;y&＃39;]) p &＃61; Point(11, y&＃61;22) # instantiate with positional or keyword arguments print(Point.__doc__) # Point(x, y) print(p.__doc__) # Point(x, y) print(p) # Point(x&＃61;11, y&＃61;22) print(p[0], p[1]) # 11 22 可以使用索引去获取namedtuple里面的元素x, y &＃61; p # 支持分包 print(x, y) # 11 22print(p.x &＃43; p.y) # 33 使用对应的字段名字也可以获取namedtuple里面的元素p.x &＃61; 33 # AttributeError: can&＃39;t set attribute 属性值只读&＃xff0c;不可修改

FrenchDeck 这个类跟任何标准Python 集合类型一样&＃xff0c;可以用len() 函数来查看一叠牌有多少张&＃xff1a;

deck &＃61; FrenchDeck() print(len(deck)) #52

从一叠牌中抽取特定的一张纸牌&＃xff0c;比如说第一张或最后一张&＃xff0c;是很容易的&＃xff1a;deck[0]或deck[-1]。这都是由__getitem__方法提供的&＃xff1a;

deck[0] #Card(rank&＃61;&＃39;2&＃39;, suit&＃61;&＃39;spades&＃39;) deck[-1] #Card(rank&＃61;&＃39;A&＃39;, suit&＃61;&＃39;hearts&＃39;) print(type(deck[0])) # print(type(deck[:])) # 仅仅实现了__getitem__ 方法&＃xff0c;这一摞牌就变成可迭代的了

我们需要单独写一个方法用来随机抽取一张纸牌吗&＃xff1f;没必要&＃xff0c;Python 已经内置了从一个序列中随机选出一个元素的函数random.choice&＃xff0c;我们直接把它用在这一摞纸牌实例上就好&＃xff1a;

from random import choice choice(deck) #Card(rank&＃61;&＃39;3&＃39;, suit&＃61;&＃39;hearts&＃39;) choice(deck) #Card(rank&＃61;&＃39;K&＃39;, suit&＃61;&＃39;spades&＃39;) choice(deck) #Card(rank&＃61;&＃39;2&＃39;, suit&＃61;&＃39;clubs&＃39;) for v in deck: # 等同于 for v in deck[:]:print(v) # Card(rank&＃61;&＃39;2&＃39;, suit&＃61;&＃39;spades&＃39;) ...print(type(v)) # ...

现在已经可以体会到通过实现特殊方法来利用Python 数据模型的两个好处。

复用你写的类时&＃xff0c;无需去记忆标准操作的各式名称&＃xff08;“怎么得到元素的总数&＃xff1f;是.size()还是.length()还是别的什么&＃xff1f;”&＃xff09;。
可以更加方便地利用Python 的标准库&＃xff0c;比如random.choice函数&＃xff0c;从而不用重新发明轮子。

迭代通常是隐式的&＃xff0c;譬如说一个集合类型没有实现__contains__方法&＃xff0c;那么in运算符就会按顺序做一次迭代搜索。于是&＃xff0c;in运算符可以用在我们的FrenchDeck 类上&＃xff0c;因为它是可迭代的&＃xff1a;

Card(&＃39;Q&＃39;, &＃39;hearts&＃39;) in deck # True Card(&＃39;7&＃39;, &＃39;beasts&＃39;) in deck # False

按照黑桃最大、红桃次之、方块再次、梅花最小的规则来给扑克牌排序的函数&＃xff0c;梅花2 的大小是0&＃xff0c;黑桃A 是51&＃xff1a;

suit_values &＃61; dict(spades&＃61;3, hearts&＃61;2, diamonds&＃61;1, clubs&＃61;0) def spades_high(card):rank_value &＃61; FrenchDeck.ranks.index(card.rank)return rank_value * len(suit_values) &＃43; suit_values[card.suit]for card in sorted(deck, key&＃61;spades_high): print(card) # Card(rank&＃61;&＃39;2&＃39;, suit&＃61;&＃39;clubs&＃39;) ... Card(rank&＃61;&＃39;A&＃39;, suit&＃61;&＃39;spades&＃39;)

1.2　如何使用特殊方法

特殊方法的存在是为了被Python 解释器调用的&＃xff0c;你无需使用my_object.__len__()调用它们&＃xff0c;应该使用len(my_object)。
使用len(my_object)时&＃xff0c;如果my_object是自定义类的对象&＃xff0c;会调用其__len__方法&＃xff1b;如果是Python 内置的类型&＃xff08;如ist、str、bytearray等&＃xff09;&＃xff0c;CPython 会直接返回PyVarObject 里的ob_size属性&＃xff0c;这比调用一个方法要快很多。
很多时候&＃xff0c;特殊方法的调用是隐式的&＃xff0c;比如for i in x:这个语句&＃xff0c;背后其实用的是iter(x)&＃xff0c;而这个函数的背后则是x.__iter__()方法。当然前提是这个方法在x 中被实现了。
不要随意添加特殊方法&＃xff0c;因为虽然现在这个名字没有被Python 内部使用&＃xff0c;以后就不一定了。

Iterable: 有迭代能力的对象&＃xff0c;一个类&＃xff0c;实现了__iter__&＃xff0c;那么就认为它有迭代能力&＃xff0c;通常此函数必须返回一个实现了__next__的对象&＃xff0c;如果自己实现了&＃xff0c;你可以返回self&＃xff0c;当然这个返回值不是必须的&＃xff1b;
Iterator: 迭代器(当然也是Iterable)&＃xff0c;同时实现了__iter__和__next__的对象&＃xff0c;缺少任何一个都不算是Iterator。

import collectionsCard &＃61; collections.namedtuple(&＃39;Card&＃39;, [&＃39;rank&＃39;, &＃39;suit&＃39;])class FrenchDeck:ranks &＃61; [str(n) for n in range(2, 11)] &＃43; list(&＃39;JQKA&＃39;)suits &＃61; &＃39;spades diamonds clubs hearts&＃39;.split()start &＃61; 0def __init__(self):self._cards &＃61; [Card(rank, suit) for suit in self.suits for rank in self.ranks]def __len__(self):return len(self._cards)def __getitem__(self, position):return self._cards[position]def __iter__(self):return selfdef __next__(self):if self.start>-len(self._cards): # 这里为了有所区别&＃xff0c;进行反向遍历self.start -&＃61; 1return self._cards[self.start] else:raise StopIteration # 不想迭代时&＃xff0c;抛出StopIteration异常(for语句会捕获此异常&＃xff0c;并结束循环)doct &＃61; FrenchDeck() for v in doct:print(v) # Card(rank&＃61;&＃39;A&＃39;, suit&＃61;&＃39;hearts&＃39;) ...

1.3　特殊方法一览

特殊方法一览

1.4　为什么len不是普通方法

如果x是一个内置类型的实例&＃xff0c;那么len(x)的速度会非常快。背后的原因是CPython 会直接从一个C 结构体里读取对象的长度&＃xff0c;完全不会调用任何方法。

换句话说&＃xff0c;len 之所以不是一个普通方法&＃xff0c;是为了让Python 自带的数据结构可以走后门&＃xff0c;abs 也是同理。但是多亏了它是特殊方法&＃xff0c;我们也可以把len 用于自定义数据类型。这种处理方式在保持内置类型的效率和保证语言的一致性之间找到了一个平衡点&＃xff0c;也印证了“Python 之禅”中的另外一句话&＃xff1a;“不能让特例特殊到开始破坏既定规则。”

1.5　本章小结

通过实现特殊方法&＃xff0c;自定义数据类型可以表现得跟内置类型一样&＃xff0c;从而让我们写出更具表达力的代码——或者说&＃xff0c;更具Python 风格的代码。

1.6　延伸阅读

推荐阅读

import
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
sum
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
import
字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流

字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ... [详细]

蜡笔小新 2024-11-12 14:07:25
import
使用 Matplotlib 保存 Python 动态图像为视频文件的方法与技巧

本文介绍了如何利用 `matplotlib` 库中的 `FuncAnimation` 类将 Python 中的动态图像保存为视频文件。通过详细解释 `FuncAnimation` 类的参数和方法，文章提供了多种实用技巧，帮助用户高效地生成高质量的动态图像视频。此外，还探讨了不同视频编码器的选择及其对输出文件质量的影响，为读者提供了全面的技术指导。 ... [详细]

蜡笔小新 2024-11-11 22:11:30
import
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
import
在 QQmlPropertyMap 的派生类中无法调用槽函数或 Q_INVOKABLE 方法？

在尝试对 QQmlPropertyMap 类进行测试驱动开发时，发现其派生类中无法正常调用槽函数或 Q_INVOKABLE 方法。这可能是由于 QQmlPropertyMap 的内部实现机制导致的，需要进一步研究以找到解决方案。 ... [详细]

蜡笔小新 2024-11-11 15:34:22
import
客户端与服务器之间的交互过程解析

本文详细解析了客户端与服务器之间的交互过程，重点介绍了Socket通信机制。IP地址由32位的4个8位二进制数组成，分为网络地址和主机地址两部分。通过使用 `ipconfig /all` 命令，用户可以查看详细的IP配置信息。此外，文章还介绍了如何使用 `ping` 命令测试网络连通性，例如 `ping 127.0.0.1` 可以检测本机网络是否正常。这些技术细节对于理解网络通信的基本原理具有重要意义。 ... [详细]

蜡笔小新 2024-11-11 15:09:25
import
Python 程序转换为 EXE 文件：详细解析 .py 脚本打包成独立可执行文件的方法与技巧

在开发了几个简单的爬虫 Python 程序后，我决定将其封装成独立的可执行文件以便于分发和使用。为了实现这一目标，首先需要解决的是如何将 Python 脚本转换为 EXE 文件。在这个过程中，我选择了 Qt 作为 GUI 框架，因为之前对此并不熟悉，希望通过这个项目进一步学习和掌握 Qt 的基本用法。本文将详细介绍从 .py 脚本到 EXE 文件的整个过程，包括所需工具、具体步骤以及常见问题的解决方案。 ... [详细]

蜡笔小新 2024-11-09 14:59:47
import
Pandas 散点图矩阵（scatter_matrix）绘图功能及其参数详解

通过使用 `pandas` 库中的 `scatter_matrix` 函数，可以有效地绘制出多个特征之间的两两关系。该函数不仅能够生成散点图矩阵，还能通过参数如 `frame`、`alpha`、`c`、`figsize` 和 `ax` 等进行自定义设置，以满足不同的可视化需求。此外，`diagonal` 参数允许用户选择对角线上的图表类型，例如直方图或密度图，从而提供更多的数据洞察。 ... [详细]

蜡笔小新 2024-11-09 12:03:42
sum
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
import
实验九：使用SharedPreferences存储简单数据

本实验旨在帮助学生理解和掌握使用SharedPreferences存储和读取简单数据的方法，包括程序参数和用户选项。 ... [详细]

蜡笔小新 2024-11-12 14:21:47
import
使用Python和smtplib实现邮件发送功能

本文详细介绍了如何使用Python中的smtplib库来发送带有附件的邮件，并提供了完整的代码示例。作者：多测师_王sir，时间：2020年5月20日 17:24，微信：15367499889，公司：上海多测师信息有限公司。 ... [详细]

蜡笔小新 2024-11-12 12:21:27
import
检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0

检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0 ... [详细]

蜡笔小新 2024-11-12 11:35:01
filter
python解决CSF布料模拟滤波的批处理问题（解决获取多个点云数据las数据）

解决问题：1、批量读取点云las数据2、点云数据读与写出3、csf滤波分类参考：https:github.comsuyunzzzCSF论文题目ÿ ... [详细]

蜡笔小新 2024-11-12 11:32:15
import
利用Python Paramiko库批量更新多台服务器的登录密码

本文介绍了如何使用Python的Paramiko库批量更新多台服务器的登录密码。通过示例代码展示了具体实现方法，确保了操作的高效性和安全性。Paramiko库提供了强大的SSH2协议支持，使得远程服务器管理变得更加便捷。此外，文章还详细说明了代码的各个部分，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-11 19:17:23