python教程分享Python线程池thread pool创建使用及实例代码分享

作者：wzcheng1984 | 来源：互联网 | 2023-07-06 23:57

前言首先线程和线程池不管在哪个语言里面，理论都是通用的。对于开发来说，解决高并发问题离不开对多个线程处理。我们先从线程到线程池，从每个线程的运行到多个线程并行，再到线程池管理。由浅

前言

首先线程和线程池不管在哪个语言里面，理论都是通用的。对于开发来说，解决高并发问题离不开对多个线程处理。我们先从线程到线程池，从每个线程的运行到多个线程并行，再到线程池管理。由浅入深的理解如何在实际开发中，使用线程池来提高处理线程的效率。

一、线程

1.线程介绍

线程（英语：thread）是操作系统能够进行运算调度的最小单位。它被包含在进程之中，是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流，一个进程中可以并发多个线程，每条线程并行执行不同的任务。在unix system v及sun中也被称为轻量进程（lightweight processes），但轻量进程更多指内核线程（kernel thread），而把用户线程（user thread）称为线程。

60年代，在os中能拥有资源和独立运行的基本单位是进程，然而随着计算机技术的发展，进程出现了很多弊端，一是由于进程是资源拥有者，创建、撤消与切换存在较大的时空开销，因此需要引入轻型进程；二是由于对称多处理机（smp）出现，可以满足多个运行单位，而多个进程并行开销过大。因此在80年代，出现了能独立运行的基本单位——线程（threads）。

线程是独立调度和分派的基本单位。线程可以为操作系统内核调度的内核线程，如win32线程；由用户进程自行调度的用户线程，如linux平台的posix thread；或者由内核与用户进程，如windows 10的线程，进行混合调度。

同一进程中的多条线程将共享该进程中的全部系统资源，如虚拟地址空间，文件描述符和信号处理等等。但同一进程中的多个线程有各自的调用栈（call stack），自己的寄存器环境（register context），自己的线程本地存储（thread-local storage）。

一个进程可以有很多线程，每条线程并行执行不同的任务。

2.线程特性

轻型实体

线程中的实体基本上不拥有系统资源，只是有一点必不可少的、能保证独立运行的资源。

线程的实体包括程序、数据和tcb。线程是动态概念，它的动态特性由线程控制块tcb（thread control block）描述。tcb包括以下信息：

（1）线程状态
（2）当线程不运行时，被保存的现场资源。
（3）一组执行堆栈。
（4）存放每个线程的局部变量主存区。
（5）访问同一个进程中的主存和其它资源。

用于指示被执行指令序列的、保留局部变量、少数状态参数和返回地址等的一组寄存器和堆栈。

独立调度和分派的基本单位

在多线程os中，线程是能独立运行的基本单位，因而也是独立调度和分派的基本单位。由于线程很“轻”，故线程的切换非常迅速且开销小（在同一进程中的）。

可并发执行

在一个进程中的多个线程之间，可以并发执行，甚至允许在一个进程中所有线程都能并发执行；同样，不同进程中的线程也能并发执行，充分利用和发挥了处理机与外围设备并行工作的能力。

共享进程资源

在同一进程中的各个线程，都可以共享该进程所拥有的资源，这首先表现在：所有线程都具有相同的地址空间（进程的地址空间），这意味着，线程可以访问该地址空间的每一个虚地址；此外，还可以访问进程所拥有的已打开文件、定时器等。由于同一个进程内的线程共享内存和文件，所以线程之间互相通信不必调用内核。

二、线程池

线程池（英语：thread pool）：一种线程使用模式。线程过多会带来调度开销，进而影响缓存局部性和整体性能。而线程池维护着多个线程，等待着监督管理者分配可并发执行的任务。这避免了在处理短时间任务时创建与销毁线程的代价。线程池不仅能够保证内核的充分利用，还能防止过分调度。可用线程数量应该取决于可用的并发处理器、处理器内核、内存、网络sockets等的数量。例如，线程数一般取cpu数量+2比较合适，线程数过多会导致额外的线程切换开销。

Python线程池thread pool创建使用及实例代码分享

任务调度以执行线程的常见方法是使用同步队列，称作任务队列。池中的线程等待队列中的任务，并把执行完的任务放入完成队列中。

线程池模式一般分为两种：hs/ha半同步/半异步模式、l/f领导者与跟随者模式。

hs/ha半同步/半异步模式：

半同步/半异步模式又称为生产者消费者模式，是比较常见的实现方式，比较简单。分为同步层、队列层、异步层三层。同步层的主线程处理工作任务并存入工作队列，工作线程从工作队列取出任务进行处理，如果工作队列为空，则取不到任务的工作线程进入挂起状态。由于线程间有数据通信，因此不适于大数据量交换的场合。

l/f领导者与跟随者模式：

领导者跟随者模式，在线程池中的线程可处在3种状态之一：领导者leader、追随者follower或工作者processor。任何时刻线程池只有一个领导者线程。事件到达时，领导者线程负责消息分离，并从处于追随者线程中选出一个来当继任领导者，然后将自身设置为工作者状态去处置该事件。处理完毕后工作者线程将自身的状态置为追随者。这一模式实现复杂，但避免了线程间交换任务数据，提高了cpu cache相似性。在ace(adaptive communication environment)中，提供了领导者跟随者模式实现。

线程池的伸缩性对性能有较大的影响。

创建太多线程，将会浪费一定的资源，有些线程未被充分使用。
销毁太多线程，将导致之后浪费时间再次创建它们。
创建线程太慢，将会导致长时间的等待，性能变差。
销毁线程太慢，导致其它线程资源饥饿。

在面向对象编程中，创建和销毁对象是很费时间的，因为创建一个对象要获取内存资源或者其它更多资源。在java中更是如此，虚拟机将试图跟踪每一个对象，以便能够在对象销毁后进行垃圾回收。所以提高服务程序效率的一个手段就是尽可能减少创建和销毁对象的次数，特别是一些很耗资源的对象创建和销毁。如何利用已有对象来服务就是一个需要解决的关键问题，其实这就是一些""池化资源""技术产生的原因。比如大家所熟悉的数据库连接池正是遵循这一思想而产生的，python教程分享Python线程池thread pool创建使用及实例代码分享将介绍的线程池技术同样符合这一思想。

三、线程池的设计思路

首先我们根据上述已经了解了线程和线程池创建目的以及作用。让我们自己思考一下，如果是自己的业务上要用到大量的请求或者是查询处理，而我们只能的机器并不能一下就接受这么多的task涌入计算，这将消耗我们计算机大量资源。这时我们就该创建线程池来对线程进行管理，我们可以给线程预留一定的空间，让请求逐个进入线程处理，当请求超过我们给的线程数量时，等一个线程跑完了再跑下一个，这样就不会造成资源的浪费和达到资源重复利用。

那么我们建立线程池的思路就有一下几点：

控制线程，给予每个线程任务保证线程正常运行。
限制线程数量，保证系统有足够的运行空间。
资源复用，保证每个线程运行完成任务后能再度利用。
控制运行时间，线程运行超过一定时间后停止任务转接下个任务，防止线程堵塞。

有了这些思路，我们就可以充分利用python自带的库来构建线程池了。

四、python线程池构建

1.构建思路

第一步，我们需要在线程池里面创建出很多个线程。第二步，当得到一个请求时候，就使用一个线程来运行·它。第三步，若多个任务则分配多个线程来运行。当其中一个线程运行完它的任务之后，将再次进行下一个任务使用。

2.实现库功能函数

首先python标准库里面是有threading库的，但是该库并没有线程池这个模块。要快速构建线程池，可以利用concurrent.futures，该库提供了threadpoolexecutor和processpoolexecutor两个类，实现了对threading和multiprocessing的进一步抽象。

这里我们只讨论threadpoolexecutor：

from concurrent.futures import threadpoolexecutor

这里我们可以看java关于线程池的设计：

构造方法:

public threadpoolexecutor(int corepoolsize, //核心线程数量                                int maximumpoolsize,//     最大线程数                                long keepalivetime, //       最大空闲时间                                timeunit unit,         //        时间单位                                blockingqueue workqueue,   //   任务队列                                threadfactory threadfactory,    // 线程工厂                                rejectedexecutionhandler handler  //  饱和处理机制      )   { ... }

参数和python创建线程池是一样的，python创建线程池：

#encoding:utf-8  from concurrent.futures import threadpoolexecutor  import threading  #创建一个包含2条线程的线程池  pool = threadpoolexecutor(max_workers = 2)  #定义两个线程

这样就建立了一条简单的线程池，其中最大线程数为2 .

def task(i):      sleep_secOnds= random.randint(1, 3)    #随机睡眠时间      print('线程名称：%s，参数：%s，睡眠时间：%s' % (threading.current_thread().name, i, sleep_seconds))      time.sleep(sleep_seconds)   #定义睡眠时间  for i in range(10):#创建十个任务      future1 = pool.submit(task, i)

Python线程池thread pool创建使用及实例代码分享

threadpoolexecutor（）

构造线程池实例，传入max_workers可以设置线程池中最多能同时运行的线程数目

submit（）

提交线程需要执行的任务（函数名和参数）到线程池中，立刻返回一个future对象。

result()

取task的执行结果：

Python线程池thread pool创建使用及实例代码分享

cancel()

取消该 future 代表的线程任务。如果该任务正在执行，不可取消，则该方法返回 false；否则，程序会取消该任务，并返回 true。

Python线程池thread pool创建使用及实例代码分享

调高点睡眠时间：

Python线程池thread pool创建使用及实例代码分享

cancelled()

返回 future 代表的线程任务是否被成功取消。

for i in range(5):#创建十个线程      future1 = pool.submit(task, i)      print(future1.cancelled())

Python线程池thread pool创建使用及实例代码分享

running()

for i in range(5):#创建十个线程      future1 = pool.submit(task, i)      print(future1.running())

Python线程池thread pool创建使用及实例代码分享

as_completed()

as_completed()方法是一个生成器，在没有任务完成的时候，会阻塞，在有某个任务完成的时候，会yield这个任务，就能执行for循环下面的语句，然后继续阻塞住，循环到所有的任务结束。从结果也可以看出，先完成的任务会先通知主线程。

Python线程池thread pool创建使用及实例代码分享

map()

除了submit，threadpoolexecutor还提供了map函数来添加线程，与常规的map类似，区别在于线程池的 map() 函数会为 iterables 的每个元素启动一个线程，以并发方式来执行 func 函数. 同时，使用map函数，还会自动获取返回值。

#向线程池提交5个任务  x = np.arange(5)  for i in pool.map(task,x):        print('successful')

Python线程池thread pool创建使用及实例代码分享

到此这篇关于python线程池(thread pool)创建使用及实例代码分享的文章就介绍到这了,更多相关python线程池创建内容请搜索<编程笔记>以前的文章或继续浏览下面的相关文章希望大家以后多多支持<编程笔记>！

需要了解更多python教程分享Python线程池thread pool创建使用及实例代码分享，都可以关注python教程分享栏目&＃8212;编程笔记

推荐阅读

char
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
list
Python高级之网络编程及TCP/IP协议簇的OSI七层模型介绍

本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容，主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]

蜡笔小新 2023-12-14 18:16:27
list
操作系统的定义和功能

本文介绍了操作系统的定义和功能，包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别，包括进程和线程的定义和作用。 ... [详细]

蜡笔小新 2023-12-11 14:17:13
express
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
char
在Linux系统上编译安装MySQL 5.5源码详细指南

本文详细介绍了在Linux系统上编译安装MySQL 5.5源码的步骤。首先，通过Yum安装必要的依赖软件包，如GCC、GCC-C++等，确保编译环境的完备。接着，下载并解压MySQL 5.5的源码包，配置编译选项，进行编译和安装。最后，完成安装后，进行基本的配置和启动测试，确保MySQL服务正常运行。 ... [详细]

蜡笔小新 2024-11-08 19:06:26
go
FastDFS Nginx 扩展模块的源代码解析与技术剖析

FastDFS Nginx 扩展模块的源代码解析与技术剖析 ... [详细]

蜡笔小新 2024-11-04 20:15:18
window
深入解析OpenCV中的人脸检测算法实现

本文详细探讨了OpenCV中人脸检测算法的实现原理与代码结构。通过分析核心函数和关键步骤，揭示了OpenCV如何高效地进行人脸检测。文章不仅提供了代码示例，还深入解释了算法背后的数学模型和优化技巧，为开发者提供了全面的理解和实用的参考。 ... [详细]

蜡笔小新 2024-11-02 13:37:20
list
深入理解Spark框架：RDD核心概念与操作详解

RDD是Spark框架的核心计算模型，全称为弹性分布式数据集（Resilient Distributed Dataset）。本文详细解析了RDD的基本概念、特性及其在Spark中的关键操作，包括创建、转换和行动操作等，帮助读者深入理解Spark的工作原理和优化策略。通过具体示例和代码片段，进一步阐述了如何高效利用RDD进行大数据处理。 ... [详细]

蜡笔小新 2024-10-29 20:10:01
list
ZeroMQ基础篇（套接字的创建zmq_socket、zmq_close、zmq_bind、zmq_unbind、zmq_connect等）

0MQ(ZeroMQ)是一个轻量级消息内核。它可用于C、C++、Python、.NETMono、Fortran和Java语言。它运行在AIX，FreeBSD的，基于HP-UX，Li ... [详细]

蜡笔小新 2024-10-13 17:07:35
list
Java 8 开发环境搭建指南

本文详细介绍了如何在 Windows 系统上搭建 Java 8 开发环境，包括 JDK 的下载、安装以及环境变量的配置。同时，还提供了 Eclipse IDE 的下载和安装步骤。 ... [详细]

蜡笔小新 2024-11-14 17:14:13
list
Native与HTML5交互基础教程

本文将介绍如何在混合开发（Hybrid）应用中实现Native与HTML5的交互，包括基本概念、学习目标以及具体的实现步骤。 ... [详细]

蜡笔小新 2024-11-14 12:33:11
go
帝国CMS中的信息归档功能详解及其重要性

本文详细解析了帝国CMS中的信息归档功能，并探讨了其在内容管理中的重要性。通过归档功能，用户可以有效地管理和组织大量内容，提高网站的运行效率和用户体验。此外，文章还介绍了如何利用该功能进行数据备份和恢复，确保网站数据的安全性和完整性。 ... [详细]

蜡笔小新 2024-11-09 20:42:14
config
在CentOS上部署和配置FreeSWITCH

在CentOS系统上部署和配置FreeSWITCH的过程涉及多个步骤。本文详细介绍了从源代码安装FreeSWITCH的方法，包括必要的依赖项安装、编译和配置过程。此外，还提供了常见的配置选项和故障排除技巧，帮助用户顺利完成部署并确保系统的稳定运行。 ... [详细]

蜡笔小新 2024-11-01 09:14:29
list
HBase在金融大数据迁移中的应用与挑战

随着最后一台设备的下线，标志着超过10PB的HBase数据迁移项目顺利完成。目前，新的集群已在新机房稳定运行超过两个月，监控数据显示，新集群的查询响应时间显著降低，系统稳定性大幅提升。此外，数据消费的波动也变得更加平滑，整体性能得到了显著优化。 ... [详细]

蜡笔小新 2024-10-31 14:06:06
list
java socket error_异常Java.net.SocketException: Unrecognized Windows Sockets error: 0: JVM_Bind处理方法...

最近在启动tomcat的时候抛出异常Java.net.SocketException:UnrecognizedWindowsSocketserror:0:JVM_Bind异常&#x ... [详细]

蜡笔小新 2024-10-16 15:51:37

wzcheng1984

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章