深入解析Python协程：asyncio模块的应用与优化

作者：enjoy楠神 | 来源：互联网 | 2024-10-30 18:17

在处理大规模并发请求时，传统的多线程或多进程模型往往无法有效解决性能瓶颈问题。尽管它们在处理小规模任务时能提升效率，但在高并发场景下，系统资源的过度消耗和上下文切换的开销会显著降低整体性能。相比之下，Python的`asyncio`模块通过协程提供了一种轻量级且高效的并发解决方案。本文将深入解析`asyncio`模块的原理及其在实际应用中的优化技巧，帮助开发者更好地利用协程技术提升程序性能。

为什么使用协程？

当多线程或者多进程足够多时，实际上并不能解决性能的瓶颈问题，也就是多线程和多进程对小规模的请求可以提高效率，过多的请求实际上会降低服务资源响应效率，因此协程是更好的解决文案。

什么是协程？

当一个程序遇到阻塞时，如果将这个程序挂起，然后将它的cpu权限拿出来去执行我们的其他程序，执行完后再回过头来执行这些挂起的程序，此时所有非阻塞操作已经执行完毕，最后在一起执行阻塞程序，是不是相当于做了异步。

因此，协程的作用就是检测阻塞的程序，在单进程和单线程的情况下实现异步，相比多线程和多进程效率更高。

asyncio协程模块（python3.5以上）

协程的代码基本构成

特殊函数
- 在普通函数前添加一个async关键字，则该函数就变成一个特殊的函数
- 特殊函数的特殊之处是什么？
  - 1.特殊函数被调用后，函数内部的程序语句（函数体）没有被立即执行
  - 2.特殊函数被调用后，会返回一个协程对象
协程：
- 调用特殊函数即创建一个协程对象。
- 因此，协程对象 = 特殊的函数 = 函数体（一组指定形式的操作）
任务：
- 任务对象就是一个高级的协程对象，即任务对象可以绑定一个回调函数
- 任务对象 = 协程对象 == 函数体（一组指定形式的操作）
事件循环：
- 事件循环对象，,可以将其当做是一个容器，该容器是用来装载任务对象的。创建好了一个或多个任务对象后，将任务对象装载到事件循环中，启动事件循环对象，则其内部装载的任务对象对应的相关操作就会被立即执行。

import asyncio import time # 创建特殊函数，一般将有阻塞操作设置特殊函数，在普通函数前加关键字async async def get_request(url):print(&＃39;正在请求的网址是:&＃39;,url)time.sleep(2)print(&＃39;请求网址结束！&＃39;)return 123# 自定义一个回调函数（一般来做数据解析），给任务对象使用:必须有一个参数，用来获取特殊函数的返回值 def t_callback(t):#参数t就是任务对象data = t.result() #result()函数就可以返回特殊函数内部的返回值print(&＃39;获取到特殊函数的返回值为:&＃39;,data)# 创建协程对象 c = get_request(&＃39;www.123.com&＃39;)# 创建任务对象 task = asyncio.ensure_future(c)# 任务对象添加回调函数,事件对象启用的时候，特殊函数和回调函数按顺序执行 task.add_done_callback(t_callback)#创建事件循环对象 loop = asyncio.get_event_loop() loop.run_until_complete(task)

多任务的协程

特殊函数内部，不可以出现不支持异步模块的代码，否则会中断整个异步效果，例如sleep，requests，可以通过执行程序来判断。具体操作如下：

添加多个任务需要使用：wait()函数，其他代码省略，看最后一步 &＃39;&＃39;&＃39; 特殊函数回调函数协程对象 &＃39;&＃39;&＃39;tasks = [] for url in urls:c = get_request(url)task = asyncio.ensure_future(c)task.add_done_callback(parse)tasks.append(task) loop = asyncio.get_event_loop() loop.run_until_complete(asyncio.wait(tasks))

await关键字：挂起发生阻塞操作的任务对象。在任务对象表示的操作中，凡是阻塞操作的前面都必须加上await关键字进行修饰，但不是所有阻塞操作都可以加await,需要添加支持协程的阻塞操作，await才会生效async def get_request(url):print(&＃39;正在请求：&＃39;,url)await asyncio.sleep(2)print(&＃39;请求结束:&＃39;,url)

完整代码

# 特殊函数先写出基本的网络请求框架，然后在每个with前面加async，每个阻塞操作前await，便于看懂和记忆 # 使用with是为了关闭协程，避免浪费资源 import asyncio import time from lxml import etree import aiohttp start = time.time() urls = [&＃39;https://www.baidu.com&＃39;,&＃39;https://www.baidu.com&＃39;,&＃39;https://www.baidu.com&＃39; ] #该任务是用来对指定url发起请求，获取响应数据 async def get_request(url):# requests是不支持异步的模块,所以加了await也没用# respOnse= await requests.get(url=url)#aiohttp是支持协程的网络请求，跟requests类似，创建请求对象（aiohttp_requests）async with aiohttp.ClientSession() as aiohttp_requests:#get请求，常用参数：url,headers,params,proxy#post请求，常用参数：url,headers,data,proxy#aiohttp处理代理的参数和requests不一样（注意），此处处理代理使用proxy=&＃39;http://ip:port&＃39;async with await aiohttp_requests.get(url=url) as response:page_text = await response.text()#text():获取字符串形式的响应数据#read()：获取二进制形式的响应数据await asyncio.sleep(2)return page_text def call_back(t):#回调函数专门用于数据解析#获取任务对象请求到的页面源码数据page_text = t.result()tree = etree.HTML(page_text)a = tree.xpath(&＃39;//a[1]/@href&＃39;)print(a)tasks = [] for url in urls:c = get_request(url)task = asyncio.ensure_future(c)task.add_done_callback(call_back)tasks.append(task) loop = asyncio.get_event_loop() loop.run_until_complete(asyncio.wait(tasks))print(&＃39;总耗时:&＃39;,time.time()-start)

uvloop加速

uvloop基于libuv，libuv是一个使用C语言实现的高性能异步I/O库，uvloop用来代替asyncio默认事件循环，可以进一步加快异步I/O操作的速度。

import uvloop loop = asyncio.get_event_loop() asyncio.set_event_loop_policy(uvloop.EventLoopPolicy()) # 在启用事件前加这一行代码即可 loop.run_until_complete(asyncio.wait(tasks))

推荐阅读

int
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
string
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
int
基于KVM的SRIOV直通配置及性能测试

SRIOV介绍、VF直通配置，以及包转发率性能测试小慢哥的原创文章，欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]

蜡笔小新 2024-12-25 19:26:39
string
优化局域网SSH连接延迟问题的解决方案

本文介绍了解决局域网内SSH连接到服务器时出现长时间等待问题的方法。通过调整配置和优化网络设置，可以显著缩短SSH连接的时间。 ... [详细]

蜡笔小新 2024-12-25 11:31:48
int
优化Windows系统以提升DAW性能

配置Windows操作系统以确保DAW（数字音频工作站）硬件和软件的高效运行可能是一个复杂且令人沮丧的过程。本文提供了一系列专业建议，帮助你优化Windows系统，确保录音和音频处理的流畅性。 ... [详细]

蜡笔小新 2024-12-25 09:41:14
select
通过Web界面管理Linux日志的解决方案

本指南介绍了一种利用rsyslog、MariaDB和LogAnalyzer搭建集中式日志管理平台的方法，使用户可以通过Web界面查看和分析Linux系统的日志记录。此方案不仅适用于服务器环境，还提供了详细的步骤来确保系统的稳定性和安全性。 ... [详细]

蜡笔小新 2024-12-24 17:11:38
select
实现鼠标坐标转换的 Tooltip 弹出层

本文介绍如何通过 JavaScript 实现一个基于鼠标坐标的 Tooltip 弹出层，详细解释了如何获取窗口和文档的尺寸及滚动位置，并优化了代码结构。 ... [详细]

蜡笔小新 2024-12-24 14:12:09
int
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
int
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
int
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
int
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
case
MySQL 数据库迁移指南：从本地到远程及磁盘间迁移

本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移，包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机，以及解决迁移过程中可能遇到的问题。 ... [详细]

蜡笔小新 2024-12-26 13:21:38
int
MySQL索引详解与优化

本文深入探讨了MySQL中的索引机制，包括索引的基本概念、优势与劣势、分类及其实现原理，并详细介绍了索引的使用场景和优化技巧。通过具体示例，帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]

蜡笔小新 2024-12-25 19:52:47
metadata
选择适合生产环境的Docker存储驱动

本文旨在探讨如何在生产环境中选择合适的Docker存储驱动，并详细介绍不同Linux发行版下的配置方法。通过参考官方文档和兼容性矩阵，提供实用的操作指南。 ... [详细]

蜡笔小新 2024-12-24 11:16:45
int
深入解析Redis内存对象模型

本文详细介绍了Redis内存对象模型的关键知识点，包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析，帮助读者全面理解Redis内存管理机制。 ... [详细]

蜡笔小新 2024-12-23 14:50:23

enjoy楠神

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章