python3线程池源码解析_源码解读TDengine中线程池的实现

作者：郝韵G | 来源：互联网 | 2023-09-02 10:28

这篇文章中提到了tsched的源码可以一读，所以去阅读了一下，总共220来行。1.阅读前工作通过上文了解到这段程序实现的是一个任务队列，同

这篇文章中提到了 tsched 的源码可以一读&＃xff0c;所以去阅读了一下&＃xff0c;总共220来行。

1. 阅读前工作

通过上文了解到这段程序实现的是一个任务队列&＃xff0c;同时带有线程池。这段程序是计算机操作系统里经典的consumer-producer (生产者-消费者)问题的实现。凡是学过操作系统这门课的&＃xff0c;都应该知道这个问题&＃xff0c;做过习题。在阅读源码之前可以先尝试用伪代码实现上述生产者-消费者问题。

2. 如何阅读&＃xff1f;

了解清楚使用场景

这是一个线程池&＃xff0c;客户端可以提交任务&＃xff0c;线程池按照顺序调度执行任务。通过阅读 tsched.h 头文件&＃xff0c;知道主要有三个函数&＃xff1a;

初始化命名的调度器、线程池&＃xff1a;taosInitScheduler

生产者提交某个任务&＃xff1a;taosScheduleTask

程序结束时的清理工作&＃xff1a;taosCleanUpScheduler

通过搜索上述三个函数的调用&＃xff0c; 知道初始化了两个调度器&＃xff0c;有三个地方会提交任务。

两个线程池

定时器里的 tmr 线程池 : 队列长度一万&＃xff0c;只有一个线程服务。此线程会执行到期的 timer 的回调函数。

tsc 线程池&＃xff1a;队列长度一万&＃xff0c;线程数量为所在机器 CPU 核心数的一半。这些线程负责&＃xff1a;异步操作如执行语句&＃xff0c;固定大小滑动窗口流式数据处理

两个生产者

上面提到了&＃xff0c;有三个生产者会提交任务给线程池&＃xff1a;

timer

stream

了解了清楚使用方、使用场景后&＃xff0c;就容易读懂逻辑了。这里是一个标准的操作系统中生产者消费者的问题&＃xff0c;用的也是标准解法&＃xff1a;使用一个互斥量&＃xff0c;两个信号量。线程池使用 pthread 来创建。

关键的数据结构

SSchedQueue 里面就是上述问题中的核心数据结构&＃xff0c;除了放置上述提到的互斥量&＃xff0c;信号量&＃xff0c;还需要一个队列来存储要具体执行的任务。

SSchedMsg 结构来表示线程池任务&＃xff0c;包含要执行的具体函数及所需参数。

源码里注释并不多&＃xff0c;只能通过看具体实现来了解上述支持的执行模式。看到支持两种模式&＃xff1a;执行fp&＃xff0c;或者执行 tfp(ahandle, thandle)。

核心调度逻辑

上面提到了生产者&＃xff0c;一直没有提到消费者。接着读 sched.c 里的源码&＃xff0c;可以看到消费者就是线程池里每个线程的主框架逻辑&＃xff1a; taosProcessSchedQueue。平常这些线程处于阻塞状态&＃xff0c;等待任务。一旦生产者提交任务后&＃xff0c;就会通知到消费者。消费者拿到提交的任务及参数&＃xff0c;去执行。执行完之后继续进入上述阻塞的状态&＃xff0c;这样周而复始。

这里有个疑问&＃xff0c;消费者和生产者之间是异步的。消费完之后&＃xff0c;总得有办法通知消费者&＃xff0c;这一步在哪里做呢&＃xff1f;读到这里可以花点时间翻翻源码&＃xff0c;找找答案。

其实秘密也藏在当时提交任务的数据结构里。TDengine 里有样例代码&＃xff0c;翻了翻&＃xff0c;找到了这个 async demo。可以看到 taos_query_a 就是一个异步的query函数&＃xff0c;里面带了 query语句异步执行完成后的回调函数&＃xff1a;taos_insert_call_back)。

3. 一些思考

看的时候内心不断在思考、对比&＃xff0c;比如优势、劣势是什么&＃xff1f;我会怎么实现

优势

为何使用线程池&＃xff1f;

通过固定线程池大小来固定资源开销&＃xff0c;而且是程序初始化时申请资源&＃xff0c;这在嵌入式设备里是非常重要的&＃xff0c;如果资源不够用&＃xff0c;那就快速失败&＃xff0c;在程序一开始启动时就报错。

复用了线程&＃xff0c;因为创建、销毁线程都是有开销的。这样在频繁创建、销毁线程情况下&＃xff0c;可以节省开销&＃xff0c;复用之前的线程。

任务和线程解耦&＃xff1a;需要使用多线程的地方&＃xff0c;只管提交任务就好了。线程的初始化、运行、状态切换由线程池来负责。

劣势

操作异步化&＃xff0c;对程序员的心智要求更高。需要使用回调函数&＃xff0c;需要存储上下文。但是在上述场景里还好&＃xff0c; 都是一些固定的逻辑。

调试较麻烦&＃xff0c;不是直来直去的逻辑。需要通过分析上下文及回调函数里的日志来分析问题。

有没有其他实现方式&＃xff1f;

如果用 Go 语言实现&＃xff0c;会很简单。使用 channel 来做任务分发&＃xff0c;本身就是线程安全的。

使用 C 来写&＃xff0c;个人觉得会限制 TDengine 的开源参与方。因为现在市场上会 C 的人比较少&＃xff0c;而且主要集中在嵌入式领域。而且 C 的生态一般&＃xff0c;语言的轮子比较少&＃xff0c;所以很多工作都需要自己做&＃xff0c;比如 http server&＃xff0c;rpc 等。如果让我来设计实现 TDengine&＃xff0c;我可能会优先考虑 Rust&＃xff0c;既能精准控制内存&＃xff0c;又有比较完善的社区&＃xff0c;而且语言处于上升期&＃xff0c;容易成为其中的明星项目&＃xff0c;会有推广优势&＃xff0c;比如能吸引一些本身对数据库不怎么关注&＃xff0c;但是对 Rust 感兴趣的程序员。

4. 一个思考题

通过搜索 pthread_create 可以发现系统中还有其他创建线程的地方&＃xff0c;并没有用到上述的线程池&＃xff0c;比如 dnodeMWrite, TcpPool&＃xff0c;cache&＃xff0c;sync等。这些地方为什么没有使用线程池呢&＃xff1f;

欢迎关注我的微信公众账号&＃xff0c;会在第一时间更新&＃xff0c;博客园上只有部分文章会发布

推荐阅读

js
深入剖析JVM垃圾回收机制

本文详细探讨了Java虚拟机（JVM）中的垃圾回收机制，包括其意义、对象判定方法、引用类型、常见垃圾收集算法以及各种垃圾收集器的特点和工作原理。通过理解这些内容，开发人员可以更好地优化内存管理和程序性能。 ... [详细]

蜡笔小新 2024-12-20 17:24:41
js
优化Flask应用的并发处理：解决Mysql连接过多问题

本文探讨了在Flask应用中通过优化后端架构来应对高并发请求，特别是针对Mysql 'too many connections' 错误的解决方案。我们将介绍如何利用Redis缓存、Gunicorn多进程和Celery异步任务队列来提升系统的性能和稳定性。 ... [详细]

蜡笔小新 2024-12-21 09:21:49
merge
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
merge
微软Exchange服务器遭遇2022年版“千年虫”漏洞

微软Exchange服务器在新年伊始遭遇了一个类似于‘千年虫’的日期处理漏洞，导致邮件传输受阻。该问题主要影响配置了FIP-FS恶意软件引擎的Exchange 2016和2019版本。 ... [详细]

蜡笔小新 2024-12-25 14:08:03
future
优化Spring Boot项目，大幅提升并发性能

本文探讨了如何通过一系列技术手段提升Spring Boot项目的并发处理能力，解决生产环境中因慢请求导致的系统性能下降问题。 ... [详细]

蜡笔小新 2024-12-19 21:07:12
function
FinOps 与 Serverless 的结合：破解云成本难题

本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理，提出了首个 Serverless 函数总成本估计模型，并分享了多种有效的成本优化策略。 ... [详细]

蜡笔小新 2024-12-24 12:44:26
header
Servlet 表单处理：GET 和 POST 请求的深入解析

本文详细探讨了HTML表单中GET和POST请求的区别，包括它们的工作原理、数据传输方式、安全性及适用场景。同时，通过实例展示了如何在Servlet中处理这两种请求。 ... [详细]

蜡笔小新 2024-12-23 18:09:59
header
全面解析运维监控：白盒与黑盒监控及四大黄金指标

本文深入探讨了白盒和黑盒监控的概念，以及它们在系统监控中的应用。通过详细分析基础监控和业务监控的不同采集方法，结合四个黄金指标的解读，帮助读者更好地理解和实施有效的监控策略。 ... [详细]

蜡笔小新 2024-12-22 14:02:29
c语言
深入解析GCD：任务队列与多线程编程

本文详细介绍了Grand Central Dispatch (GCD) 的核心概念和使用方法，探讨了任务队列、同步与异步执行以及常见的死锁问题。通过具体示例和代码片段，帮助开发者更好地理解和应用GCD进行多线程开发。 ... [详细]

蜡笔小新 2024-12-22 10:11:08
future
并发编程 12—— 任务取消与关闭之 shutdownNow 的局限性

Java并发编程实践目录并发编程01——ThreadLocal并发编程02——ConcurrentHashMap并发编程03——阻塞队列和生产者-消费者模式并发编程04——闭锁Co ... [详细]

蜡笔小新 2024-12-21 12:39:07
process
UNIX进程间通信（IPC）详解

本文深入探讨了UNIX/Linux系统中的进程间通信（IPC）机制，包括消息传递、同步和共享内存等。详细介绍了管道（Pipe）、有名管道（FIFO）、Posix和System V消息队列、互斥锁与条件变量、读写锁、信号量以及共享内存的使用方法和应用场景。 ... [详细]

蜡笔小新 2024-12-20 10:14:51
process
Google排名优化－面向Google(Search Engine Friendly)的URL设计

Google排名优化－面向Google(Search Engine Friendly)的URL设计 ... [详细]

蜡笔小新 2024-12-19 16:16:50
js
Windows 多进程通信API总结

在一个大型的应用系统中，往往需要多个进程相互协作，进程间通信(IPC,InterProcessCommunication)就显得比较重要了。在Linux系统中，有很多种IPC机制， ... [详细]

蜡笔小新 2024-11-30 13:13:03
jar
Spring Boot 服务的最大并发处理能力

本文探讨了 Spring Boot 应用程序在不同配置下支持的最大并发连接数，重点分析了内置服务器（如 Tomcat、Jetty 和 Undertow）的默认设置及其对性能的影响。 ... [详细]

蜡笔小新 2024-12-25 16:45:57
jar
掌握Java EE的全面指南

探讨如何真正掌握Java EE，包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法，并提供了详尽的标准。 ... [详细]

蜡笔小新 2024-12-25 13:38:29

郝韵G

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章