当前位置: 开发笔记 > 编程语言 > 正文

Python并发编程进阶：从初学者到高手的进程与模块开发指南

作者：飘移zj_114 | 来源：互联网 | 2024-10-27 13:52

篇首语：本文由编程笔记#小编为大家整理，主要介绍了python并发编程--进程--其他模块-从菜鸟到老鸟相关的知识，希望对你有一定的参考价值。 concurrent模块1、concurrent模块的介

篇首语：本文由编程笔记#小编为大家整理，主要介绍了python并发编程--进程--其他模块-从菜鸟到老鸟相关的知识，希望对你有一定的参考价值。

concurrent模块

1、concurrent模块的介绍

concurrent.futures模块提供了高度封装的异步调用接口
- ThreadPoolExecutor：线程池，提供异步调用
- ProcessPoolExecutor：进程池，提供异步调用

ProcessPoolExecutor 和 ThreadPoolExecutor：两者都实现相同的接口，该接口由抽象Executor类定义。

2、基本方法

使用_base.Executor

concurrent.futures.thread.ThreadPoolExecutor #线程池
concurrent.futures.process.ProcessPoolExecutor #进程池
#构造函数
　　def __init__(self, max_workers=None, mp_cOntext=None,
　　initializer=None, initargs=()):

submit(fn, *args, **kwargs) :异步提交任务

　　　　使用submit函数来提交线程需要执行任务(函数名和参数)到线程池中，并返回该任务的句柄(类似于文件、画图)，注意submit()不是阻塞的，而是立即返回。

map(func, *iterables, timeout=None, chunksize=1)

　　　　取代for循环submit的操作

shutdown(wait=True) ：相当于进程池的pool.close()+pool.join()操作
- wait=True，等待池内所有任务执行完毕回收完资源后才继续
- wait=False，立即返回，并不会等待池内的任务执行完毕
- 但不管wait参数为何值，整个程序都会等到所有任务执行完毕

note：submit和map必须在shutdown之前

pool.submit()返回的对象是

concurrent.futures._base.Future类

add_done_callback(self,fn)
cancel(self)
cancelled(self)
done(self)
exception(self,timeout=None)
result(self,timeout=None)
running(self)
set_exception(self,exception)
set_result(self,result)
set_running_or_notify_cancel(self)

result(timeout=None) ：取得结果，通过submit函数返回的任务句柄,使用result()方法可以获取任务的返回值，查看内部代码，发现这个方法是阻塞的

done()方法判断该任务是否结束

add_done_callback(fn) ：回调函数

3、进程池和线程池

　　池的功能：限制进程数或线程数.

　　什么时候限制：当并发的任务数量远远大于计算机所能承受的范围,即无法一次性开启过多的任务数量我就应该考虑去限制我进程数或线程数,从保证服务器不崩.

3.1 进程池

from concurrent.futures import ProcessPoolExecutor
import os
import time
def task(i):
print("第"+str(i)+"个在执行任务id:"+str(os.getpid()))
time.sleep(1)
if __name__ == \'__main__\':
start=time.time()
pool = ProcessPoolExecutor(4) # 进程池里又4个进程
for i in range(5): # 5个任务
pool.submit(task,i)# 进程池里当前执行的任务i，池子里的4个进程一次一次执行任务
pool.shutdown()
print("耗时：",time.time()-start)

3.2 线程池

from concurrent.futures import ThreadPoolExecutor
from threading import currentThread
import time
def task(i):
print("第"+str(i)+"个在执行任务id:"+currentThread().name)
time.sleep(1)
if __name__ == \'__main__\':
start = time.time()
pool = ThreadPoolExecutor(4) # 进程池里又4个线程
for i in range(5): # 5个任务
pool.submit(task,i)# 线程池里当前执行的任务i，池子里的4个线程一次一次执行任务
pool.shutdown()
print("耗时：",time.time()-start)

　　其他：done() 、 result()

通过submit函数返回的任务句柄,能够使用done()方法判断该任务是否结束

使用result()方法可以获取任务的返回值，查看内部代码，发现这个方法是阻塞的

3.4列表+as_compelete模拟先进先出

　　　　对于线程，这样可以模拟执行与结果的先进先出。

　　　　但是对于进程会报错。

import time
from concurrent.futures import ProcessPoolExecutor,as_completed,ThreadPoolExecutor
def get_html(i):
times=1
time.sleep(times)
print("第 NO.{i} get page {times} finished".format(i=i,times=times))
return "第 NO.{i} ".format(i=i)
start=time.time()
executor = ThreadPoolExecutor(max_workers=2)
# executor = ProcessPoolExecutor(max_workers=2) #进程池会导致后面的all_task报错

all_task = [executor.submit(get_html,(i)) for i in range(5)]
for future in as_completed(all_task):
data = future.result()
print("in main:get page {} success".format(data))
print(\'主进程结束--耗时\',time.time()-start)

结果：

第 NO.0 get page 1 finished
第 NO.1 get page 1 finished
in main:get page 第 NO.0 success
in main:get page 第 NO.1 success
第 NO.2 get page 1 finished
in main:get page 第 NO.2 success
第 NO.3 get page 1 finished
in main:get page 第 NO.3 success
第 NO.4 get page 1 finished
in main:get page 第 NO.4 success
主进程结束--耗时 3.0034666061401367

结果：

3.4 Map的用法

可以将多个任务一次性的提交给进程、线程池。---备注进程是也不行的，也会报错。

使用map方法，不需提前使用submit方法，map方法与python标准库中的map含义相同，都是将序列中的每个元素都执行同一个函数。

from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor
import os,time,random
def task(i):
print("第"+str(i)+"个在执行任务id:"+str(os.getpid()))
time.sleep(1)
if __name__ == \'__main__\':
start=time.time()
pool=ProcessPoolExecutor(max_workers=3) #也可以换成ThreadPoolExecutor
pool.map(task,range(1,5)) #map取代了for+submit
pool.shutdown()
print("耗时：",time.time()-start)

考虑到结果返回值：

import time
from random import random
from concurrent.futures import ProcessPoolExecutor,as_completed,ThreadPoolExecutor
def get_html(i):
times=1+random()/100
time.sleep(times)
print("第 NO.{i} get page {times}s finished".format(i=i,times=times))
return "第 NO.{i} ".format(i=i)
start=time.time()
executor = ThreadPoolExecutor(max_workers=2)
# executor = ProcessPoolExecutor(max_workers=2) #进程池会导致后面的executor.map报错
res=executor.map(get_html, range(5))
#
for future in res: #直接返回结果，不需要get
print("in main:get page {} success".format(future))
print(\'主进程结束--耗时\',time.time()-start)

3.5 同步调用，顺序返回

因为我们在循环中每次循环都要调用或这说提交任务，并等待结果。所以其实进程之间是串行的。所以是同步的方式。

from concurrent.futures import ProcessPoolExecutor
from multiprocessing import current_process
import time
n = 1
def task(i):
global n
time.sleep(1)
print(f\'{current_process().name} 在执行任务{i}\')
n += i
return f\'得到 {current_process().name} 任务{i} 的结果\'
if __name__ == \'__main__\':
start=time.time()
pool = ProcessPoolExecutor(2) # 进程池里又4个线程
pool_lis = []
for i in range(5): # 20个任务
future = pool.submit(task,i)# 进程池里当前执行的任务i，池子里的4个线程一次一次执行任务

pool_lis.append(future.result()) #等待我执行任务得到的结果,如果一直没有结果，则阻塞。这里会导致我们所有任务编程了串行
# 在这里就引出了下面的pool.shutdown()方法
pool.shutdown(wait=True) # 关闭了池的入口，不允许在往里面添加任务了，会等带所有的任务执行完，结束阻塞
for res in pool_lis:
print(res)
print(n)# 这里肯定是拿到0的
print("主进程---耗时",time.time()-start)
# 可以用join去解决，等待每一个进程结束后，拿到他的结果

结果：

SpawnProcess-2 在执行任务0
SpawnProcess-1 在执行任务1
SpawnProcess-2 在执行任务2
SpawnProcess-1 在执行任务3
SpawnProcess-2 在执行任务4
得到 SpawnProcess-2 任务0 的结果
得到 SpawnProcess-1 任务1 的结果
得到 SpawnProcess-2 任务2 的结果
得到 SpawnProcess-1 任务3 的结果
得到 SpawnProcess-2 任务4 的结果
1
主进程---耗时 5.575225830078125

同步--所以是串行的。耗时与单进程差不多

3.5 异步调用，顺序返回

from concurrent.futures import ProcessPoolExecutor
from multiprocessing import current_process
import time
n = 1
def task(i):
global n
time.sleep(1)
print(f\'{current_process().name} 在执行任务{i}\')
n += i
return f\'得到 {current_process().name} 任务{i} 的结果\'
if __name__ == \'__main__\':
start=time.time()
pool = ProcessPoolExecutor(2) # 进程池里又4个线程
pool_lis = []
for i in range(5): # 20个任务
future = pool.submit(task,i)# 进程池里当前执行的任务i，池子里的4个线程一次一次执行任务
# print(future.result()) # 这是在等待我执行任务得到的结果，如果一直没有结果，这里会导致我们所有任务编程了串行
# 在这里就引出了下面的pool.shutdown()方法
pool_lis.append(future)
pool.shutdown(wait=True) # 关闭了池的入口，不允许在往里面添加任务了，会等带所有的任务执行完，结束阻塞
for p in pool_lis:
print(p.result())
print(n)# 这里肯定是拿到0的
print("主进程---耗时",time.time()-start)
# 可以用join去解决，等待每一个进程结束后，拿到他的结果

结果：

SpawnProcess-1 在执行任务0
SpawnProcess-2 在执行任务1
SpawnProcess-1 在执行任务2
SpawnProcess-2 在执行任务3
SpawnProcess-1 在执行任务4
得到 SpawnProcess-1 任务0 的结果
得到 SpawnProcess-2 任务1 的结果
得到 SpawnProcess-1 任务2 的结果
得到 SpawnProcess-2 任务3 的结果
得到 SpawnProcess-1 任务4 的结果
1
主进程---耗时 3.2690603733062744

异步结果，有序返回相应结果

3.5 回调函数：

add_done_callback

from multiprocessing import current_process
import time
from random import random
from concurrent.futures import ProcessPoolExecutor
def task(i):
print(f\'{current_process().name} 在执行{i}\')
time.sleep(1+random())
return i
# parse 就是一个回调函数
def parse(future):
# 处理拿到的结果
print(f\'{current_process().name} 拿到结果{future.result()} 结束了当前任务\')
if __name__ == \'__main__\':
start=time.time()
pool = ProcessPoolExecutor(2)
for i in range(5):
future = pool.submit(task,i)
\'\'\'
给当前执行的任务绑定了一个函数，在当前任务结束的时候就会触发这个函数（称之为回调函数）
会把future对象作为参数传给函数
注：这个称为回调函数，当前任务处理结束了，就回来调parse这个函数
\'\'\'
future.add_done_callback(parse)
# add_done_callback (parse) parse是一个回调函数
# add_done_callback () 是对象的一个绑定方法，他的参数就是一个函数
pool.shutdown()
print(\'主线程耗时：\',time.time()-start)

结果:

SpawnProcess-1 在执行0
SpawnProcess-2 在执行1
SpawnProcess-2 在执行2
MainProcess 拿到结果1 结束了当前任务
SpawnProcess-1 在执行3
MainProcess 拿到结果0 结束了当前任务
SpawnProcess-1 在执行4
MainProcess 拿到结果3 结束了当前任务
MainProcess 拿到结果2 结束了当前任务
MainProcess 拿到结果4 结束了当前任务
主线程耗时： 4.721129417419434

回调是主进程的，结果是无序的

3.6wait

wait方法可以让主线程阻塞,直到满足设定的要求。wait方法接收3个参数，等待的任务序列、超时时间以及等待条件。

等待条件return_when默认为ALL_COMPLETED,表明要等待所有的任务都借宿。

可以看到运行结果中，确实是所有任务都完成了，主线程才打印出main,等待条件还可以设置为FIRST_COMPLETED,表示第一个任务完成就停止等待

from concurrent.futures import ThreadPoolExecutor,wait,ALL_COMPLETED,FIRST_COMPLETED
import time
#参数times用来模拟网络请求时间
from random import random
def get_html(i):
times=1+random()*10
time.sleep(times)
print("第 NO.{i} get page {times}s finished".format(i=i,times=times))
return "第 NO.{i} ".format(i=i)
executor = ThreadPoolExecutor(max_workers=2)
urls = range(5)
all_task = [executor.submit(get_html,(url)) for url in urls]
wait(all_task,return_when=ALL_COMPLETED)
print("main")

joblib模块

官网

推荐阅读

cmd
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
callback
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
io
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
io
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
tags
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
io
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
io
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
cmd
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
io
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
io
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
io
RecyclerView初步学习(一)

RecyclerView初步学习(一)ReCyclerView提供了一种插件式的编程模式，除了提供ViewHolder缓存模式，还可以自定义动画，分割符，布局样式，相比于传统的ListVi ... [详细]

蜡笔小新 2024-12-26 20:24:01
io
优化Kafka流状态存储查询的最佳实践

本文探讨了如何优化和正确配置Kafka Streams应用程序以确保准确的状态存储查询。通过调整配置参数和代码逻辑，可以有效解决数据不一致的问题。 ... [详细]

蜡笔小新 2024-12-26 18:17:14
io
Spring Boot DevTools 实现项目自动重启功能

本文介绍了如何使用 Spring Boot DevTools 实现应用程序在开发过程中自动重启。这一特性显著提高了开发效率，特别是在集成开发环境（IDE）中工作时，能够提供快速的反馈循环。默认情况下，DevTools 会监控类路径上的文件变化，并根据需要触发应用重启。 ... [详细]

蜡笔小新 2024-12-28 04:42:15
io
JQuery基础：省市联动与表单验证

本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先，通过change事件监听用户选择的省份，并动态加载对应的城市列表。其次，详细讲解了使用Validation插件进行表单验证的方法，包括内置规则、自定义规则及实时验证功能。 ... [详细]

蜡笔小新 2024-12-27 17:10:48
io
如何通过按钮聚焦ListView的TextCell？ - How to focus ListView's TextCell by button?

IneedtofocusTextCellsonebyoneviaabuttonclick.ItriedlistView.ScrollTo.我需要通过点击按钮逐个关注Tex ... [详细]

蜡笔小新 2024-12-27 17:02:23

飘移zj_114

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章