热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

linux多线程或多进程epoll处理accept惊群问题

什么是惊群简单说,惊群是因为多进程(多线程)在同时阻塞等待同一个事件的时候(休眠状态),当时间

什么是惊群

简单说,惊群是因为多进程(多线程)在同时阻塞等待同一个事件的时候(休眠状态),当时间发生时,就会唤醒所有等待的(休眠的)进程(线程)。但是事件只能被一个进程或线程处理,而其他进程(线程)获取失败,只能重新进入休眠状态,这种现象和性能浪费就叫做惊群。

产生惊群的条件


  1. 多个进程或者多个线程
  2. 同时等待处理一个事件

具体场景复现

测试环境 :

  1. debian11
  2. 内核5.10.0-8
  3. 编译器 clang11

多线程和多进程在惊群问题上差不多,为了少些一点,下文中没有特殊说明,多线程 也包含了多进程

在linux中,使用C/C++ 编写 tcp server时,会依次调用 socket() bind() listen() accept() 这几个函数,这几个函数会打开socket,绑定ip和端口,开始监听端口,accept函数会阻塞当前进程,等待客户端连接。

如果在单线程中,只有一个accept函数在等待客户端连接,当客户端来连接的时候,只会有一个accept函数来处理,所以也不会存在惊群问题了。

在多线模型中,多个线程分别accept同一个socket,当有客户端连接时,内核会通知所有的线程来处理这个请求,但是呢,请求只能被一个线程处理,其他的线程的不到这个事件,只能白白被唤醒。

这是最简单的一种惊群,这种情况在linux2.6以后就不会产生了。因为在Linux 2.6 版本之后,通过引入一个标记位 WQ_FLAG_EXCLUSIVE,解决掉了 Accept 惊群效应。我原本还想在centos3.9(内核版本是2.5)中去复现这种情况,但是折腾了好久,也没能在centos上编译也运行C++程序,遂放弃。 不废话了,上代码,测试第一种情况

#include
#include
#include
#include
#include
#include
#include #define WORKER_THREAD 4
//创建socket,并返回fd
int createSocket() {int fd &#61; socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);if (fd <0) {std::cout <<"create socket error" <}void Worker1(int socketFd, int k) {std::cout <<" Worker" <}int main() {std::mutex mutex;std::unique_lock lck(mutex);std::condition_variable cv;int fd &#61; createSocket();//第一种,多个线程不使用多路复用,accept同一个socketfor (int i &#61; 0; i }

这代码可以用C写&#xff0c;但是习惯用C&#43;&#43;了&#xff0c;就用C&#43;&#43;写吧。代码也比较简单&#xff0c;createSocket()创建了一个socket&#xff0c;然后4个线程分别去accept这个socket。 下面是运行结果&#xff1a;

可以看到&#xff0c;4个线程都在运行&#xff0c;并且accept&#xff0c;但是当连接来的时候&#xff0c;只有个线程能得到事件。

既然linux内核已经帮我们处理了惊群&#xff0c;那我们还考虑这些干啥&#xff0c;直接用不就完了。

但是&#xff0c;我们在写代码的时候一般不会直接阻塞accept的&#xff0c;都是使用多路复用来帮我们处理连接阻塞的是多路复用函数。目前综合性能比较好的IO多路复用是epoll。当在多线程中使用epoll时&#xff0c;惊群问题就会出现了。 先代码和结果&#xff0c;然后再解释

#include
#include
#include
#include
#include
#include
#include #define WORKER_THREAD 4
//创建socket&#xff0c;并返回fd
int createSocket() {int fd &#61; socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);if (fd <0) {std::cout <<"create socket error" <}void Worker2(int socketFd, int k) {std::cout <<" Worker" <}int main() {std::mutex mutex;std::unique_lock lck(mutex);std::condition_variable cv;int fd &#61; createSocket();//第二种,多个线程使用epoll多路复用,accept同一个socketfor (int i &#61; 0; i }

结果

这里可以看到&#xff0c;当有客户端来连接的时候&#xff0c;4个线程都被唤醒了&#xff0c;但是只有workr2 线程成功获取了事件&#xff0c;其余的3个线程都白白唤醒浪费了性能

情景下的惊群问题&#xff0c;第二种情景下的惊群问题为啥就不处理了呢&#xff1f;

相关视频推荐


 

我的猜想不一定正确&#xff0c;如果有错误&#xff0c;请指出&#xff1a;

accept 只能是被一个进程调用成功&#xff08;连接事件只会处理一次嘛&#xff09;&#xff0c;所以内核就直接处理了&#xff08;一个accept只会唤醒一个进程&#xff09;。但 epoll 不一样&#xff0c;epoll中管理了很多连接&#xff0c;不止socket这一个&#xff0c;除了可能后续被 accept 调用外&#xff0c;还有可能是其他网络 IO 事件的&#xff0c;而其他 IO 事件是否只能由一个进程处理&#xff0c;是不一定的&#xff0c;这是一个由用户决定的事情&#xff0c;例如可能一个文件会由多个进程来读写。所以&#xff0c;对 epoll 默认对于多进程监听同一文件不会设置互斥&#xff0c;所以就导致了epoll惊群问题。

在linux4.5内核之后给epoll添加了一个 EPOLLEXCLUSIVE的标志位&#xff0c;如果设置了这个标志位&#xff0c;那epoll将进程挂到等待队列时将会设置一下互斥标志位&#xff0c;这时实现跟内核原生accept一样的特性&#xff0c;只会唤醒队列中的一个进程。

修改一下worker2函数:

void Worker2(int socketFd, int k) {std::cout <<" Worker" <}

现在来测试一下

现在的epoll已经不会有惊群问题了

另一种方式

其实解决多线程使用epoll等多路复用导致的惊群问题&#xff0c;还有一个更彻底解决方法&#xff0c;让每个线程分别打开一个socket&#xff0c;并且这些socket绑定在同一个端口&#xff0c;然后accept这个socket。这就像第一种情景那样&#xff0c;内核直接帮我们做了惊群处理。这里会使用到 linux 3.9后 socket提供SO_REUSEPORT标志。使用这个标志后&#xff0c;会允许多个socket绑定和监听同一个端口。 代码如下

#include
#include
#include
#include
#include
#include
#include #define WORKER_THREAD 4
//创建socket&#xff0c;并返回fd
int createSocket2() {int fd &#61; socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);if (fd &#61;&#61; -1) {std::cout <<"create socket error" <}void Worker3(int k) {std::cout <<" Worker" <}int main() {std::mutex mutex;std::unique_lock lck(mutex);std::condition_variable cv;//第三种,多个线程使用epoll多路复用,每个线程分别bind,listen 同一个端口, accept各自的socketfor (int i &#61; 0; i }

结果

也是没有问题的&#xff0c;多个连接来的时候&#xff0c;只会有一个线程被唤醒&#xff0c;相当于在内核级别中实现了一个负载均衡

总结

简单总结一下&#xff0c;当多个线程或者进程同时阻塞同一个事件的时候&#xff0c;会出现惊群现象&#xff0c;如果不适用epoll等多路复用技术&#xff0c;在linux2.6 以后内核已经帮我们处理了惊群问题。

如果使用了epoll&#xff0c;就需要额外处理epoll导致的惊群问题&#xff0c;有两种方式

  1. linux4.5内核之后&#xff0c;epoll有一个EPOLLEXCLUSIVE特性&#xff0c;可以防止epoll惊群出现
  2. linux 3.9内核之后给 socket 提供SO_REUSEPORT特性&#xff0c;可以允许多个socket绑定在同一个端口上&#xff0c;相当于每个线程都有一个socket&#xff0c;在处理accept时&#xff0c;内核会自动处理惊群问题

1和2两种方式都能有效解决惊群问题&#xff0c;但是目前使用 socket的 SO_REUSEPORT 是最好的方式.。

我通过查资料得到 EPOLLEXCLUSIVE 标识会保证一个事件发生时候只有一个线程会被唤醒&#xff0c;来避免多惊群问题。不过任一时候只能有一个Worker调用 accept&#xff0c;限制了真正并行的吞吐量。 这个有待验证&#xff0c;小伙伴有时间可以去深入了解一下。


推荐阅读
author-avatar
山中幽水_418
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有