linux多线程或多进程epoll处理accept惊群问题

作者：山中幽水_418 | 来源：互联网 | 2023-07-20 13:02

什么是惊群简单说，惊群是因为多进程（多线程）在同时阻塞等待同一个事件的时候（休眠状态），当时间

什么是惊群

简单说&＃xff0c;惊群是因为多进程&＃xff08;多线程&＃xff09;在同时阻塞等待同一个事件的时候&＃xff08;休眠状态&＃xff09;&＃xff0c;当时间发生时&＃xff0c;就会唤醒所有等待的&＃xff08;休眠的&＃xff09;进程&＃xff08;线程&＃xff09;。但是事件只能被一个进程或线程处理&＃xff0c;而其他进程&＃xff08;线程&＃xff09;获取失败&＃xff0c;只能重新进入休眠状态&＃xff0c;这种现象和性能浪费就叫做惊群。

产生惊群的条件

多个进程或者多个线程
同时等待处理一个事件

具体场景复现

测试环境 :

debian11
内核5.10.0-8
编译器 clang11

多线程和多进程在惊群问题上差不多&＃xff0c;为了少些一点&＃xff0c;下文中没有特殊说明&＃xff0c;多线程也包含了多进程

在linux中&＃xff0c;使用C/C&＃43;&＃43; 编写 tcp server时&＃xff0c;会依次调用 socket() bind() listen() accept() 这几个函数&＃xff0c;这几个函数会打开socket&＃xff0c;绑定ip和端口&＃xff0c;开始监听端口&＃xff0c;accept函数会阻塞当前进程&＃xff0c;等待客户端连接。

如果在单线程中&＃xff0c;只有一个accept函数在等待客户端连接&＃xff0c;当客户端来连接的时候&＃xff0c;只会有一个accept函数来处理&＃xff0c;所以也不会存在惊群问题了。

在多线模型中&＃xff0c;多个线程分别accept同一个socket&＃xff0c;当有客户端连接时&＃xff0c;内核会通知所有的线程来处理这个请求&＃xff0c;但是呢&＃xff0c;请求只能被一个线程处理&＃xff0c;其他的线程的不到这个事件&＃xff0c;只能白白被唤醒。

这是最简单的一种惊群&＃xff0c;这种情况在linux2.6以后就不会产生了。因为在Linux 2.6 版本之后&＃xff0c;通过引入一个标记位 WQ_FLAG_EXCLUSIVE&＃xff0c;解决掉了 Accept 惊群效应。我原本还想在centos3.9&＃xff08;内核版本是2.5&＃xff09;中去复现这种情况&＃xff0c;但是折腾了好久&＃xff0c;也没能在centos上编译也运行C&＃43;&＃43;程序&＃xff0c;遂放弃。不废话了&＃xff0c;上代码&＃xff0c;测试第一种情况

#include #include #include #include #include #include #include #define WORKER_THREAD 4 //创建socket&＃xff0c;并返回fd int createSocket() {int fd &＃61; socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);if (fd <0) {std::cout <<"create socket error" <}void Worker1(int socketFd, int k) {std::cout <<" Worker" <}int main() {std::mutex mutex;std::unique_lock lck(mutex);std::condition_variable cv;int fd &＃61; createSocket();//第一种,多个线程不使用多路复用,accept同一个socketfor (int i &＃61; 0; i }

这代码可以用C写&＃xff0c;但是习惯用C&＃43;&＃43;了&＃xff0c;就用C&＃43;&＃43;写吧。代码也比较简单&＃xff0c;createSocket()创建了一个socket&＃xff0c;然后4个线程分别去accept这个socket。下面是运行结果&＃xff1a;

可以看到&＃xff0c;4个线程都在运行&＃xff0c;并且accept&＃xff0c;但是当连接来的时候&＃xff0c;只有个线程能得到事件。

既然linux内核已经帮我们处理了惊群&＃xff0c;那我们还考虑这些干啥&＃xff0c;直接用不就完了。

但是&＃xff0c;我们在写代码的时候一般不会直接阻塞accept的&＃xff0c;都是使用多路复用来帮我们处理连接阻塞的是多路复用函数。目前综合性能比较好的IO多路复用是epoll。当在多线程中使用epoll时&＃xff0c;惊群问题就会出现了。先代码和结果&＃xff0c;然后再解释

#include #include #include #include #include #include #include #define WORKER_THREAD 4 //创建socket&＃xff0c;并返回fd int createSocket() {int fd &＃61; socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);if (fd <0) {std::cout <<"create socket error" <}void Worker2(int socketFd, int k) {std::cout <<" Worker" <}int main() {std::mutex mutex;std::unique_lock lck(mutex);std::condition_variable cv;int fd &＃61; createSocket();//第二种,多个线程使用epoll多路复用,accept同一个socketfor (int i &＃61; 0; i }

结果

这里可以看到&＃xff0c;当有客户端来连接的时候&＃xff0c;4个线程都被唤醒了&＃xff0c;但是只有workr2 线程成功获取了事件&＃xff0c;其余的3个线程都白白唤醒浪费了性能

情景下的惊群问题&＃xff0c;第二种情景下的惊群问题为啥就不处理了呢&＃xff1f;

相关视频推荐

我的猜想不一定正确&＃xff0c;如果有错误&＃xff0c;请指出&＃xff1a;

accept 只能是被一个进程调用成功&＃xff08;连接事件只会处理一次嘛&＃xff09;&＃xff0c;所以内核就直接处理了&＃xff08;一个accept只会唤醒一个进程&＃xff09;。但 epoll 不一样&＃xff0c;epoll中管理了很多连接&＃xff0c;不止socket这一个&＃xff0c;除了可能后续被 accept 调用外&＃xff0c;还有可能是其他网络 IO 事件的&＃xff0c;而其他 IO 事件是否只能由一个进程处理&＃xff0c;是不一定的&＃xff0c;这是一个由用户决定的事情&＃xff0c;例如可能一个文件会由多个进程来读写。所以&＃xff0c;对 epoll 默认对于多进程监听同一文件不会设置互斥&＃xff0c;所以就导致了epoll惊群问题。

在linux4.5内核之后给epoll添加了一个 EPOLLEXCLUSIVE的标志位&＃xff0c;如果设置了这个标志位&＃xff0c;那epoll将进程挂到等待队列时将会设置一下互斥标志位&＃xff0c;这时实现跟内核原生accept一样的特性&＃xff0c;只会唤醒队列中的一个进程。

修改一下worker2函数:

void Worker2(int socketFd, int k) {std::cout <<" Worker" <}

现在来测试一下

现在的epoll已经不会有惊群问题了

另一种方式

其实解决多线程使用epoll等多路复用导致的惊群问题&＃xff0c;还有一个更彻底解决方法&＃xff0c;让每个线程分别打开一个socket&＃xff0c;并且这些socket绑定在同一个端口&＃xff0c;然后accept这个socket。这就像第一种情景那样&＃xff0c;内核直接帮我们做了惊群处理。这里会使用到 linux 3.9后 socket提供SO_REUSEPORT标志。使用这个标志后&＃xff0c;会允许多个socket绑定和监听同一个端口。代码如下

#include #include #include #include #include #include #include #define WORKER_THREAD 4 //创建socket&＃xff0c;并返回fd int createSocket2() {int fd &＃61; socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);if (fd &＃61;&＃61; -1) {std::cout <<"create socket error" <}void Worker3(int k) {std::cout <<" Worker" <}int main() {std::mutex mutex;std::unique_lock lck(mutex);std::condition_variable cv;//第三种,多个线程使用epoll多路复用,每个线程分别bind,listen 同一个端口, accept各自的socketfor (int i &＃61; 0; i }

结果

也是没有问题的&＃xff0c;多个连接来的时候&＃xff0c;只会有一个线程被唤醒&＃xff0c;相当于在内核级别中实现了一个负载均衡

总结

简单总结一下&＃xff0c;当多个线程或者进程同时阻塞同一个事件的时候&＃xff0c;会出现惊群现象&＃xff0c;如果不适用epoll等多路复用技术&＃xff0c;在linux2.6 以后内核已经帮我们处理了惊群问题。

如果使用了epoll&＃xff0c;就需要额外处理epoll导致的惊群问题&＃xff0c;有两种方式

linux4.5内核之后&＃xff0c;epoll有一个EPOLLEXCLUSIVE特性&＃xff0c;可以防止epoll惊群出现
linux 3.9内核之后给 socket 提供SO_REUSEPORT特性&＃xff0c;可以允许多个socket绑定在同一个端口上&＃xff0c;相当于每个线程都有一个socket&＃xff0c;在处理accept时&＃xff0c;内核会自动处理惊群问题

1和2两种方式都能有效解决惊群问题&＃xff0c;但是目前使用 socket的 SO_REUSEPORT 是最好的方式.。

我通过查资料得到 EPOLLEXCLUSIVE 标识会保证一个事件发生时候只有一个线程会被唤醒&＃xff0c;来避免多惊群问题。不过任一时候只能有一个Worker调用 accept&＃xff0c;限制了真正并行的吞吐量。这个有待验证&＃xff0c;小伙伴有时间可以去深入了解一下。

推荐阅读

ip
[二分图]JZOJ 4612 游戏

DescriptionInputOutputSampleInput44#****#****#*xxx#SampleOutput5DataConstraint分析非常眼熟࿰ ... [详细]

蜡笔小新 2024-09-28 18:03:01
include
在ROS中处理yaml文件

在ROS系统中，参数读写一般通过xml或者yaml格式的文件，其中yaml用得比较多。这是一种可读性高，轻量级的标记语言，简单好用。对于yaml文件，ros中用的较早版本的yaml- ... [详细]

蜡笔小新 2024-09-29 00:37:59
php
去掉英文句子中重复出现的单词和标点符号

#includestdafx.h#includeiostream#includesstream#includemap#includestring ... [详细]

蜡笔小新 2024-09-28 15:17:19
io
自己动手写下载器简单socket编程

下载器，就是一种网络工具，从网络中接收自己想要的数据。下载器是一个网络客户端。它的下载流程无非就是客户端连接服务器端，然后发送资源下载请求 ... [详细]

蜡笔小新 2024-09-28 11:59:38
ip
1150 Travelling Salesman Problem (25 分)（分析题目，细节处理）

The“travellingsalesmanproblem”asksthefollowingquestion:“Givenalistofcitiesandthedistancesb ... [详细]

蜡笔小新 2024-09-27 12:33:28
io
C++模板实现的单向链表

C模板实现的单向链表，实现了链表的初始化创建，元素插入，元素链表末尾添加，元素删除，链表清空Lists.h# ... [详细]

蜡笔小新 2024-09-29 17:51:47
ip
[USACO 2006 November Gold] 玉米地Corn Fields

题目描述　　FarmerJohn新买了一块长方形的牧场，这块牧场被划分成M行N列(1<M<12;1<N<12)，每一格都是一块正方形的土地。FJ打 ... [详细]

蜡笔小新 2024-09-29 11:31:29
ip
opencv3用椭圆拟合二维点集fitEllipse函数

#include#include#includeusingnamespacecv;usingname ... [详细]

蜡笔小新 2024-09-29 10:47:44
ip
编译linux搭建vs2015,使用Vs2015开发linux(centos7)程序

1.首先下载vs2015withupdate32.然后下载VisualCforLinuxDevelopment3.在centos7上yuminstallopenssh-server ... [详细]

蜡笔小新 2024-09-29 03:45:05
ip
PyQt 如何创建自定义QWidget

这篇文章主要介绍了PyQt如何创建自定义QWidget，帮助大家更好的理解和学习使用pyqt，感 ... [详细]

蜡笔小新 2024-09-28 17:51:22
ip
linux ipc——shared memory

1、概念共享内存：共享内存是进程间通信中最简单的方式之一。共享内存允许两个或更多进程访问同一块内存，就如同malloc()函数向不同进程返回了指向同一个 ... [详细]

蜡笔小新 2024-09-27 11:39:50
io
Logistic回归模型（C++代码实现）

Logistic回归主要针对输入的数据是多个，输出则是有限的数值型，多为2个分类。涉及到以下方面：1.输出yw0+w1*x1+w2*x2+..(x1,x2,是样本的 ... [详细]

蜡笔小新 2024-09-27 10:00:45
php
diskmark使用教程

首先说明一下软件各个参数的意义。1~9测试次数；50MB~4000MB测试规模；C,D,E,F选择测试对象；ALL测试以下所有；第一行代表你硬盘的读写速度。第二行代表你硬盘4K文件 ... [详细]

蜡笔小新 2024-09-26 14:26:50
io
RabbitMQ之队列与消息持久化

队列持久化在之前的例子中，我们所用的队列都是临时队列，当服务重启后之前创建的队列就都没有了。队列的持久化是在定义队列时的第二个参数决定的(false为队列不用持久化)channel.queueDecl ... [详细]

蜡笔小新 2024-09-26 11:48:42
数组
bzoj 4282: 慎二的随机数列最长不下降序列

题意给出一个长度为n的序列，有一些位置可以放任意的数，问最长上升序列的长度。n ... [详细]

蜡笔小新 2024-09-30 00:01:10

山中幽水_418

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章