Python3yield使用总结

作者：混迹潘_442 | 来源：互联网 | 2023-05-18 05:28

最近开始学习爬虫框架Scrapy，看大牛写的博客时，发现有段代码不知道如何理解，对，就是它：关键字yield该怎么理解？在详细查询了文档说明后，得出以下结论：一个带有yiel

最近开始学习爬虫框架Scrapy，看大牛写的博客时，发现有段代码不知道如何理解，对，就是它：关键字yield该怎么理解？

在详细查询了文档说明后，得出以下结论：

一个带有 yield 的函数就是一个 generator，它和普通函数不同，生成一个 generator 看起来像函数调用，但不会执行任何函数代码，直到对其调用 next()（在 for 循环中会自动调用 next()）才开始执行。虽然执行流程仍按函数的流程执行，但每执行到一个 yield 语句就会中断，并返回一个迭代值，下次执行时从 yield 的下一个语句继续执行。看起来就好像一个函数在正常执行的过程中被 yield 中断了数次，每次中断都会通过 yield 返回当前的迭代值。

yield 的好处是显而易见的，把一个函数改写为一个 generator 就获得了迭代能力，比起用类的实例保存状态来计算下一个 next() 的值，不仅代码简洁，而且执行流程异常清晰。

用下面的一段代码就非常好理解了。

若用next()分开执行代码(python2用next()，python3用__next__())，

当函数执行结束时，generator 自动抛出 StopIteration 异常，表示迭代完成。在 for 循环里，无需处理 StopIteration 异常，循环会正常结束。

所以优点就是利用迭代，减少内存消耗，代码更简洁；

return返回值，在第一次调用函数，yield返回迭代对象；

在一个 generator function 中，如果没有 return，则默认执行至函数完毕，如果在执行过程中 return，则直接抛出 StopIteration 终止迭代。

最后，还看到有人用yield 做文件读取。如果直接对文件对象调用 read() 方法，会导致不可预测的内存占用。好的方法是利用固定长度的缓冲区来不断读取文件内容。通过 yield，不再需要编写读文件的迭代类，就可以轻松实现文件读取

标签: python, 爬虫

推荐阅读

io
Python 3 Scrapy 框架执行流程详解

本文详细介绍了如何在 Python 3 环境下安装和使用 Scrapy 框架，包括常用命令和执行流程。Scrapy 是一个强大的 Web 抓取框架，适用于数据挖掘、监控和自动化测试等多种场景。 ... [详细]

蜡笔小新 2024-11-12 10:51:15
go
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
io
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
io
Python3 中使用 lxml 模块解析 XPath 数据详解

XPath 是一种用于在 XML 文档中查找信息的路径语言，同样适用于 HTML 文件的搜索。本文将详细介绍如何利用 Python 的 lxml 模块通过 XPath 技术高效地解析和抓取网页数据。 ... [详细]

蜡笔小新 2024-12-20 11:23:22
jar
探讨HTML中的DIV样式难题

本文深入分析了HTML中常见的DIV样式问题，并提供了有效的解决策略。适合所有对Web前端开发感兴趣的读者。 ... [详细]

蜡笔小新 2024-12-17 15:26:54
cmd
解决Python 3.x中argparse无法识别含&符号的输入参数问题

在使用Python 3.x的argparse模块时，如果输入参数中包含&符号，会遇到解析错误。本文介绍了如何解决这一问题，确保输入参数能够正确解析。 ... [详细]

蜡笔小新 2024-11-17 11:11:08
go
构建用户可查询的员工信息管理系统（上篇）

构建用户可查询的员工信息管理系统（上篇）旨在设计一个安全且易于使用的员工信息查询平台。该系统要求实现以下功能：1. 用户必须通过身份验证才能访问系统；2. 员工信息表应包含关键字段，如ID、姓名、部门和电话号码；3. 身份验证成功后，用户能够准确查询到所需信息。此外，系统还应具备数据加密和权限管理等高级功能，以确保信息安全和合规性。 ... [详细]

蜡笔小新 2024-11-02 12:33:38
random
Python 可视化 | Seaborn5 分钟入门 (六)——heatmap 热力图

微信公众号：「Python读财」如有问题或建议，请公众号留言Seaborn是基于matplotlib的Python可视化库。它提供了一个高级界面来绘制有吸引力的统计图形。Seabo ... [详细]

蜡笔小新 2023-10-17 17:48:15
io
python3 操作配置文件

一json文件JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。JSON采用完全独立于语言的文本格式，但是也使 ... [详细]

蜡笔小新 2023-10-13 12:43:20
io
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
python
推荐几款高效测量图片像素的工具

本文介绍了几款适用于Web前端开发的工具，这些工具可以帮助用户在图片上绘制线条并精确测量其像素长度。对于需要进行图像处理或设计工作的开发者来说非常实用。 ... [详细]

蜡笔小新 2024-12-20 19:17:07
python
利用Django-Crontab实现Django项目的定时任务管理

本文介绍了如何在Django项目中使用django-crontab库来设置和管理定时任务，包括安装、配置、编写定时任务以及常见问题的解决方案。通过具体实例，帮助开发者快速掌握在Django中实现自动化任务的方法。 ... [详细]

蜡笔小新 2024-12-19 14:51:39
function
前端开发中的代码注释实践与规范

本文探讨了前端开发过程中代码注释的重要性，不仅有助于个人清晰地回顾自己的编程思路，还能促进团队成员之间的有效沟通。文章将详细介绍HTML、CSS及JavaScript中的注释使用方法，并提出一套实用的注释规范。 ... [详细]

蜡笔小新 2024-12-17 10:55:06
python
探讨GET与POST请求数据传输的最大容量

在Web开发领域，GET和POST是最常见的两种数据传输方法。本文将深入探讨这两种请求方式在不同环境下的数据传输能力及其限制。 ... [详细]

蜡笔小新 2024-12-15 12:05:33
io
Python教程分享：使用plt.text给图中的点加标签，让Python画图更生动

背景：今天在用matplotlib模块画各城市2019-ncov疫情确诊人数和节前流入人口数的图的时候遇到了要给图中的点加上标签示意，原本图长这个样子现在要给各散点标注是哪个哪个城 ... [详细]

蜡笔小新 2023-10-13 17:29:42

混迹潘_442

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章