深度解析单线程的Redis如何做到每秒数万QPS的超高处理能力

作者：NethJ | 来源：互联网 | 2023-09-10 15:42

有一次去面试服务器端岗位，面试官问我有一个连接过来，你该怎么编程处理它。我答道：“主线程收到请求后，创建一个子线程处理。”面

有一次去面试服务器端岗位&＃xff0c;面试官问我有一个连接过来&＃xff0c;你该怎么编程处理它。我答道&＃xff1a;“主线程收到请求后&＃xff0c;创建一个子线程处理。” 面试官接着问&＃xff0c;那如果有一千个连接同时来呢&＃xff1f;我说“那就多创建一点线程&＃xff0c;搞个线程池”。面试官继续追问如果一万个呢&＃xff1f;我答道:“......不会...”。

事实上&＃xff0c;服务器端只需要单线程可以达到非常高的处理能力&＃xff0c;Redis 就是一个非常好的例子。仅仅靠单线程就可以支撑起每秒数万 QPS 的高处理能力。今天我们就来带大家看看 Redis 核心网络模块的内部实现&＃xff0c;学习下 Redis 是如何做到如此的高性能的&＃xff01;

一、理解多路复用原理

在开始介绍 Redis 之前&＃xff0c;我想有必要先来简单介绍下 epoll。

在传统的同步阻塞网络编程模型里&＃xff08;没有协程以前&＃xff09;&＃xff0c;性能上不来的根本原因在于进程线程都是笨重的家伙。让一个进(线)程只处理一个用户请求确确实实是有点浪费了。

先抛开高内存开销不说&＃xff0c;在海量的网络请求到来的时候&＃xff0c;光是频繁的进程线程上下文就让 CPU 疲于奔命了。

如果把进程比作牧羊人&＃xff0c;一个进(线)程同时只能处理一个用户请求&＃xff0c;相当于一个人只能看一只羊&＃xff0c;放完这一只才能放下一只。如果同时来了 1000 只羊&＃xff0c;那就得 1000 个人去放&＃xff0c;这人力成本是非常高的。

性能提升思路很简单&＃xff0c;就是让很多的用户连接来复用同一个进(线)程&＃xff0c;这就是多路复用。多路指的是许许多多个用户的网络连接。复用指的是对进(线)程的复用。换到牧羊人的例子里&＃xff0c;就是一群羊只要一个牧羊人来处理就行了。

不过复用实现起来是需要特殊的 socket 事件管理机制的&＃xff0c;最典型和高效的方案就是 epoll。放到牧羊人的例子来&＃xff0c;epoll 就相当于一只牧羊犬。

在 epoll 的系列函数里&＃xff0c; epoll_create 用于创建一个 epoll 对象&＃xff0c;epoll_ctl 用来给 epoll 对象添加或者删除一个 socket。epoll_wait 就是查看它当前管理的这些 socket 上有没有可读可写事件发生。

当网卡上收到数据包后&＃xff0c;Linux 内核进行一系列的处理后把数据放到 socket 的接收队列。然后会检查是否有 epoll 在管理它&＃xff0c;如果是则在 epoll 的就绪队列中插入一个元素。epoll_wait 的操作就非常的简单了&＃xff0c;就是到 epoll 的就绪队列上来查询有没有事件发生就行了。

在基于 epoll 的编程中&＃xff0c;和传统的函数调用思路不同的是&＃xff0c;我们并不能主动调用某个 API 来处理。因为无法知道我们想要处理的事件啥时候发生。所以只好提前把想要处理的事件的处理函数注册到一个事件分发器上去。当事件发生的时候&＃xff0c;由这个事件分发器调用回调函数进行处理。这类基于实现注册事件分发器的开发模式也叫 Reactor 模型。

相关视频推荐

面试中正经“八股文”网络原理tcp/udp&＃xff0c;网络编程epoll/reactor

6种epoll的设计&＃xff0c;让你吊打面试官&＃xff0c;而且他不能还嘴

epoll原理剖析以及三握四挥的处理

LinuxC&＃43;&＃43;后台服务器开发架构师免费学习地址

LinuxC&＃43;&＃43;后台开发学习路线&＃xff1a; Linux C/C&＃43;&＃43;后端服务器架构开发成长体系

【文章福利】&＃xff1a;小编整理了一些个人觉得比较好的学习书籍、视频资料共享在群文件里面&＃xff0c;有需要的可以自行添加哦&＃xff01;~点击832218493加入&＃xff08;需要自取&＃xff09;

二、Redis 服务启动初始化

理解了 epoll 原理后&＃xff0c;我们再来实际看 Redis 具体是如何使用 epoll 的。直接在 Github 上就可以非常方便地获取 Redis 的源码。我们切到 5.0.0 版本来看单线程版本的实现&＃xff08;多线程我们改天再讲&＃xff09;。

# git clone https://github.com/redis/redis # cd redis # git checkout -b 5.0.0 5.0.0

其中整个 Redis 服务的代码总入口在 src/server.c 文件中&＃xff0c;我把入口函数的核心部分摘了出来&＃xff0c;如下。

//file: src/server.c int main(int argc, char **argv) {......// 启动初始化initServer();// 运行事件处理循环&＃xff0c;一直到服务器关闭为止aeMain(server.el); }

其实整个 Redis 的工作过程&＃xff0c;就只需要理解清楚 main 函数中调用的 initServer 和 aeMain 这两个函数就足够了。

本节中我们重点介绍 initServer&＃xff0c;在下一节介绍事件处理循环 aeMain。在 initServer 这个函数内&＃xff0c;Redis 做了这么三件重要的事情。

创建一个 epoll 对象
对配置的监听端口进行 listen
把 listen socket 让 epoll 给管理起来

//file: src/server.c void initServer() {// 2.1.1 创建 epollserver.el &＃61; aeCreateEventLoop(server.maxclients&＃43;CONFIG_FDSET_INCR);// 2.1.2 绑定监听服务端口listenToPort(server.port,server.ipfd,&server.ipfd_count);// 2.1.3 注册 accept 事件处理器for (j &＃61; 0; j < server.ipfd_count; j&＃43;&＃43;) {aeCreateFileEvent(server.el, server.ipfd[j], AE_READABLE,acceptTcpHandler,NULL);}... }

接下来我们分别来看。

2.1 创建 epoll 对象

本小节的逻辑看起来貌似不短&＃xff0c;但其实只是创建了一个 epoll 对象出来而已。

创建 epoll 对象的逻辑在 aeCreateEventLoop 中&＃xff0c;在创建完后&＃xff0c;Redis 将其保存在 redisServer 的 aeEventLoop 成员中&＃xff0c;以备后续使用。

struct redisServer {...aeEventLoop *el; }

我们来看 aeCreateEventLoop 详细逻辑。Redis 在操作系统提供的 epoll 对象基础上又封装了一个 eventLoop 出来&＃xff0c;所以创建的时候是先申请和创建 eventLoop。

//file:src/ae.c aeEventLoop *aeCreateEventLoop(int setsize) {aeEventLoop *eventLoop;eventLoop &＃61; zmalloc(sizeof(*eventLoop);//将来的各种回调事件就都会存在这里eventLoop->events &＃61; zmalloc(sizeof(aeFileEvent)*setsize);......aeApiCreate(eventLoop);return eventLoop; }

在 eventLoop 里&＃xff0c;我们稍微注意一下 eventLoop->events&＃xff0c;将来在各种事件注册的时候都会保存到这个数组里。

//file:src/ae.h typedef struct aeEventLoop {......aeFileEvent *events; /* Registered events */ }

具体创建 epoll 的过程在 ae_epoll.c 文件下的 aeApiCreate 中。在这里&＃xff0c;真正调用了 epoll_create

//file:src/ae_epoll.c static int aeApiCreate(aeEventLoop *eventLoop) {aeApiState *state &＃61; zmalloc(sizeof(aeApiState));state->epfd &＃61; epoll_create(1024); eventLoop->apidata &＃61; state;return 0; }

2.2 绑定监听服务端口

我们再来看 Redis 中的 listen 过程&＃xff0c;它在 listenToPort 函数中。虽然调用链条很长&＃xff0c;但其实主要就是执行了个简单 listen 而已。

//file: src/redis.c int listenToPort(int port, int *fds, int *count) {for (j &＃61; 0; j < server.bindaddr_count || j &＃61;&＃61; 0; j&＃43;&＃43;) {fds[*count] &＃61; anetTcpServer(server.neterr,port,NULL,server.tcp_backlog);} }

Redis 是支持开启多个端口的&＃xff0c;所以在 listenToPort 中我们看到是启用一个循环来调用 anetTcpServer。在 anetTcpServer 中&＃xff0c;逐步会展开调用&＃xff0c;直到执行到 bind 和 listen 系统调用。

//file:src/anet.c int anetTcpServer(char *err, int port, char *bindaddr, int backlog) {return _anetTcpServer(err, port, bindaddr, AF_INET, backlog); } static int _anetTcpServer(......) {// 设置端口重用anetSetReuseAddr(err,s)// 监听anetListen(err,s,p->ai_addr,p->ai_addrlen,backlog) } static int anetListen(......) {bind(s,sa,len);listen(s, backlog);...... }

2.3 注册事件回调函数

我们回头再看一下 initServer&＃xff0c;它调用 aeCreateEventLoop 创建了 epoll&＃xff0c;调用 listenToPort 进行了服务端口的 bind 和 listen。接着就开始调用 aeCreateFileEvent 来注册一个 accept 事件处理器。

//file: src/server.c void initServer() {// 2.1.1 创建 epollserver.el &＃61; aeCreateEventLoop(server.maxclients&＃43;CONFIG_FDSET_INCR);// 2.1.2 监听服务端口listenToPort(server.port,server.ipfd,&server.ipfd_count);// 2.1.3 注册 accept 事件处理器for (j &＃61; 0; j < server.ipfd_count; j&＃43;&＃43;) {aeCreateFileEvent(server.el, server.ipfd[j], AE_READABLE,acceptTcpHandler,NULL);}... }

我们来注意看调用 aeCreateFileEvent 时传的重要参数是 acceptTcpHandler&＃xff0c;它表示将来在 listen socket 上有新用户连接到达的时候&＃xff0c;该函数将被调用执行。我们来看 aeCreateFileEvent 具体代码。

//file: src/ae.c int aeCreateFileEvent(aeEventLoop *eventLoop, int fd, int mask,aeFileProc *proc, void *clientData) {// 取出一个文件事件结构aeFileEvent *fe &＃61; &eventLoop->events[fd];// 监听指定 fd 的指定事件aeApiAddEvent(eventLoop, fd, mask);// 设置文件事件类型&＃xff0c;以及事件的处理器fe->mask |&＃61; mask;if (mask & AE_READABLE) fe->rfileProc &＃61; proc;if (mask & AE_WRITABLE) fe->wfileProc &＃61; proc;// 私有数据fe->clientData &＃61; clientData; }

函数 aeCreateFileEvent 一开始&＃xff0c;从 eventLoop->events 获取了一个 aeFileEvent 对象。在 2.1 中我们介绍过 eventLoop->events 数组&＃xff0c;注册的各种事件处理器会保存在这个地方。

接下来调用 aeApiAddEvent。这个函数其实就是对 epoll_ctl 的一个封装。主要就是实际执行 epoll_ctl EPOLL_CTL_ADD。

//file:src/ae_epoll.c static int aeApiAddEvent(aeEventLoop *eventLoop, int fd, int mask) {// add or modint op &＃61; eventLoop->events[fd].mask &＃61;&＃61; AE_NONE ?EPOLL_CTL_ADD : EPOLL_CTL_MOD;......// epoll_ctl 添加事件epoll_ctl(state->epfd,op,fd,&ee);return 0; }

每一个 eventLoop->events 元素都指向一个 aeFileEvent 对象。在这个对象上&＃xff0c;设置了三个关键东西

rfileProc&＃xff1a;读事件回调
wfileProc&＃xff1a;写事件回调
clientData&＃xff1a;一些额外的扩展数据

将来当 epoll_wait 发现某个 fd 上有事件发生的时候&＃xff0c;这样 redis 首先根据 fd 到 eventLoop->events 中查找 aeFileEvent 对象&＃xff0c;然后再看 rfileProc、wfileProc 就可以找到读、写回调处理函数。

回头看 initServer 调用 aeCreateFileEvent 时传参来看。

//file: src/server.c void initServer() {......// 2.1.3 注册 accept 事件处理器for (j &＃61; 0; j < server.ipfd_count; j&＃43;&＃43;) {aeCreateFileEvent(server.el, server.ipfd[j], AE_READABLE,acceptTcpHandler,NULL);} }

listen fd 对应的读回调函数 rfileProc 事实上就被设置成了 acceptTcpHandler&＃xff0c;写回调没有设置&＃xff0c;私有数据 client_data 也为 null。

三、Redis 事件处理循环

在上一节介绍完了 Redis 的启动初始化过程&＃xff0c;创建了 epoll&＃xff0c;也进行了绑定监听&＃xff0c;也注册了 accept 事件处理函数为 acceptTcpHandler。

//file: src/server.c int main(int argc, char **argv) {......// 启动初始化initServer();// 运行事件处理循环&＃xff0c;一直到服务器关闭为止aeMain(server.el); }

接下来&＃xff0c;Redis 就会进入 aeMain 开始进行真正的用户请求处理了。在 aeMain 函数中&＃xff0c;是一个无休止的循环。在每一次的循环中&＃xff0c;要做如下几件事情。

通过 epoll_wait 发现 listen socket 以及其它连接上的可读、可写事件
若发现 listen socket 上有新连接到达&＃xff0c;则接收新连接&＃xff0c;并追加到 epoll 中进行管理
若发现其它 socket 上有命令请求到达&＃xff0c;则读取和处理命令&＃xff0c;把命令结果写到缓存中&＃xff0c;加入写任务队列
每一次进入 epoll_wait 前都调用 beforesleep 来将写任务队列中的数据实际进行发送
如若有首次未发送完毕的&＃xff0c;当写事件发生时继续发送

//file:src/ae.c void aeMain(aeEventLoop *eventLoop) {eventLoop->stop &＃61; 0;while (!eventLoop->stop) {// 如果有需要在事件处理前执行的函数&＃xff0c;那么运行它// 3.4 beforesleep 处理写任务队列并实际发送之if (eventLoop->beforesleep !&＃61; NULL)eventLoop->beforesleep(eventLoop);// 开始等待事件并处理// 3.1 epoll_wait 发现事件// 3.2 处理新连接请求// 3.3 处理客户连接上的可读事件aeProcessEvents(eventLoop, AE_ALL_EVENTS);} }

以上就是 aeMain 函数的核心逻辑所在&＃xff0c;接下来我们分别对如上提到的四件事情进行详细的阐述。

3.1 epoll_wait 发现事件

Redis 不管有多少个用户连接&＃xff0c;都是通过 epoll_wait 来统一发现和管理其上的可读&＃xff08;包括 liisten socket 上的 accept事件&＃xff09;、可写事件的。甚至连 timer&＃xff0c;也都是交给 epoll_wait 来统一管理的。

每当 epoll_wait 发现特定的事件发生的时候&＃xff0c;就会调用相应的事先注册好的事件处理函数进行处理。我们来详细看 aeProcessEvents 对 epoll_wait 的封装。

//file:src/ae.c int aeProcessEvents(aeEventLoop *eventLoop, int flags) {// 获取最近的时间事件tvp &＃61; xxx// 处理文件事件&＃xff0c;阻塞时间由 tvp 决定numevents &＃61; aeApiPoll(eventLoop, tvp);for (j &＃61; 0; j < numevents; j&＃43;&＃43;) {// 从已就绪数组中获取事件aeFileEvent *fe &＃61; &eventLoop->events[eventLoop->fired[j].fd];//如果是读事件&＃xff0c;并且有读回调函数fe->rfileProc()//如果是写事件&＃xff0c;并且有写回调函数fe->wfileProc()} }//file: src/ae_epoll.c static int aeApiPoll(aeEventLoop *eventLoop, struct timeval *tvp) {// 等待事件aeApiState *state &＃61; eventLoop->apidata;epoll_wait(state->epfd,state->events,eventLoop->setsize,tvp ? (tvp->tv_sec*1000 &＃43; tvp->tv_usec/1000) : -1);... }

aeProcessEvents 就是调用 epoll_wait 来发现事件。当发现有某个 fd 上事件发生以后&＃xff0c;则调为其事先注册的事件处理器函数 rfileProc 和 wfileProc。

3.2 处理新连接请求

我们假设现在有新用户连接到达了。前面在我们看到 listen socket 上的 rfileProc 注册的是 acceptTcpHandler。也就是说&＃xff0c;如果有连接到达的时候&＃xff0c;会回调到 acceptTcpHandler。

在 acceptTcpHandler 中&＃xff0c;主要做了几件事情

调用 accept 系统调用把用户连接给接收回来
为这个新连接创建一个唯一 redisClient 对象
将这个新连接添加到 epoll&＃xff0c;并注册一个读事件处理函数

接下来让我们看上面这三件事情都分别是如何被处理的。

//file:src/networking.c void acceptTcpHandler(aeEventLoop *el, int fd, ...) {cfd &＃61; anetTcpAccept(server.neterr, fd, cip, ...);acceptCommonHandler(cfd,0); }

在 anetTcpAccept 中执行非常的简单&＃xff0c;就是调用 accept 把连接接收回来。

//file: src/anet.c int anetTcpAccept(......) {anetGenericAccept(err,s,(struct sockaddr*)&sa,&salen) } static int anetGenericAccept(......) {fd &＃61; accept(s,sa,len) }

接下来在 acceptCommonHandler 为这个新的客户端连接 socket&＃xff0c;创建一个 redisClient 对象。

//file: src/networking.c static void acceptCommonHandler(int fd, int flags) {// 创建 redisClient 对象redisClient *c;c &＃61; createClient(fd);...... }

在 createClient 中&＃xff0c;创建 client 对象&＃xff0c;并且为该用户连接注册了读事件处理器。

//file:src/networking.c redisClient *createClient(int fd) {// 为用户连接创建 client 对象redisClient *c &＃61; zmalloc(sizeof(redisClient));if (fd !&＃61; -1) {...// 为用户连接注册读事件处理器aeCreateFileEvent(server.el,fd,AE_READABLE,readQueryFromClient, c)}... }

关于 aeCreateFileEvent 的处理过程这里就不赘述了&＃xff0c;详情参见 2.3 节。其效果就是将该用户连接 socket fd 对应的读处理函数设置为 readQueryFromClient, 并且设置私有数据为 redisClient c。

3.3 处理客户连接上的可读事件

现在假设该用户连接有命令到达了&＃xff0c;就假设用户发送了GET XXXXXX_KEY 命令。那么在 Redis 的时间循环中调用 epoll_wait 发现该连接上有读时间后&＃xff0c;会调用在上一节中讨论的为其注册的读处理函数 readQueryFromClient。

在读处理函数 readQueryFromClient 中主要做了这么几件事情。

解析并查找命令
调用命令处理
添加写任务到队列
将输出写到缓存等待发送

我们来详细地看 readQueryFromClient 的代码。在 readQueryFromClient 中会调用 processInputBuffer&＃xff0c;然后进入 processCommand 对命令进行处理。其调用链如下&＃xff1a;

//file: src/networking.c void readQueryFromClient(aeEventLoop *el, int fd, void *privdata, ...) {redisClient *c &＃61; (redisClient*) privdata;processInputBufferAndReplicate(c); }void processInputBufferAndReplicate(client *c) {...processInputBuffer(c); }// 处理客户端输入的命令内容 void processInputBuffer(redisClient *c) {// 执行命令&＃xff0c;processCommand(c); }

我们再来详细看 processCommand 。

//file: int processCommand(redisClient *c) { // 查找命令&＃xff0c;并进行命令合法性检查&＃xff0c;以及命令参数个数检查c->cmd &＃61; c->lastcmd &＃61; lookupCommand(c->argv[0]->ptr);......// 处理命令// 如果是 MULTI 事务&＃xff0c;则入队&＃xff0c;否则调用 call 直接处理if (c->flags & CLIENT_MULTI && ...){queueMultiCommand(c);} else {call(c,CMD_CALL_FULL);...}return C_OK; }

我们先忽略 queueMultiCommand&＃xff0c;直接看核心命令处理方法 call。

//file:src/server.c void call(client *c, int flags) {// 查找处理命令&＃xff0c;struct redisCommand *real_cmd &＃61; c->cmd;// 调用命令处理函数c->cmd->proc(c);...... }

在 server.c 中定义了每一个命令对应的处理函数

//file:src/server.c struct redisCommand redisCommandTable[] &＃61; {{"module",moduleCommand,-2,"as",0,NULL,0,0,0,0,0},{"get",getCommand,2,"rF",0,NULL,1,1,1,0,0},{"set",setCommand,-3,"wm",0,NULL,1,1,1,0,0},{"setnx",setnxCommand,3,"wmF",0,NULL,1,1,1,0,0},{"setex",setexCommand,4,"wm",0,NULL,1,1,1,0,0},......{"mget",mgetCommand,-2,"rF",0,NULL,1,-1,1,0,0},{"rpush",rpushCommand,-3,"wmF",0,NULL,1,1,1,0,0},{"lpush",lpushCommand,-3,"wmF",0,NULL,1,1,1,0,0},{"rpushx",rpushxCommand,-3,"wmF",0,NULL,1,1,1,0,0},...... }

对于 get 命令来说&＃xff0c;其对应的命令处理函数就是 getCommand。也就是说当处理 GET 命令执行到 c->cmd->proc 的时候会进入到 getCommand 函数中来。

//file: src/t_string.c void getCommand(client *c) {getGenericCommand(c); } int getGenericCommand(client *c) {robj *o;if ((o &＃61; lookupKeyReadOrReply(c,c->argv[1],shared.null[c->resp])) &＃61;&＃61; NULL)return C_OK;...addReplyBulk(c,o);return C_OK; }

getGenericCommand 方法会调用 lookupKeyReadOrReply 来从内存中查找对应的 key值。如果找不到&＃xff0c;则直接返回 C_OK&＃xff1b;如果找到了&＃xff0c;调用 addReplyBulk 方法将值添加到输出缓冲区中。

//file: src/networking.c void addReplyBulk(client *c, robj *obj) {addReplyBulkLen(c,obj);addReply(c,obj);addReply(c,shared.crlf); }

其主题是调用 addReply 来设置回复数据。在 addReply 方法中做了两件事情&＃xff1a;

prepareClientToWrite 判断是否需要返回数据&＃xff0c;并且将当前 client 添加到等待写返回数据队列中。
调用 _addReplyToBuffer 和 _addReplyObjectToList 方法将返回值写入到输出缓冲区中&＃xff0c;等待写入 socekt

//file:src/networking.c void addReply(client *c, robj *obj) {if (prepareClientToWrite(c) !&＃61; C_OK) return;if (sdsEncodedObject(obj)) {if (_addReplyToBuffer(c,obj->ptr,sdslen(obj->ptr)) !&＃61; C_OK)_addReplyStringToList(c,obj->ptr,sdslen(obj->ptr));} else {...... } }

先来看 prepareClientToWrite 的详细实现&＃xff0c;

//file: src/networking.c int prepareClientToWrite(client *c) {......if (!clientHasPendingReplies(c) && !(c->flags & CLIENT_PENDING_READ))clientInstallWriteHandler(c); }//file:src/networking.c void clientInstallWriteHandler(client *c) {c->flags |&＃61; CLIENT_PENDING_WRITE;listAddNodeHead(server.clients_pending_write,c); }

其中 server.clients_pending_write 就是我们说的任务队列&＃xff0c;队列中的每一个元素都是有待写返回数据的 client 对象。在 prepareClientToWrite 函数中&＃xff0c;把 client 添加到任务队列 server.clients_pending_write 里就算完事。

接下再来 _addReplyToBuffer&＃xff0c;该方法是向固定缓存中写&＃xff0c;如果写不下的话就继续调用 _addReplyStringToList 往链表里写。简单起见&＃xff0c;我们只看 _addReplyToBuffer 的代码。

//file:src/networking.c int _addReplyToBuffer(client *c, const char *s, size_t len) {......// 拷贝到 client 对象的 Response buffer 中memcpy(c->buf&＃43;c->bufpos,s,len);c->bufpos&＃43;&＃61;len;return C_OK; }

3.4 beforesleep 处理写任务队列

回想在 aeMain 函数中&＃xff0c;每次在进入 aeProcessEvents 前都需要先进行 beforesleep 处理。这个函数名字起的怪怪的&＃xff0c;但实际上大有用处。

//file:src/ae.c void aeMain(aeEventLoop *eventLoop) {eventLoop->stop &＃61; 0;while (!eventLoop->stop) {// beforesleep 处理写任务队列并实际发送之if (eventLoop->beforesleep !&＃61; NULL)eventLoop->beforesleep(eventLoop);aeProcessEvents(eventLoop, AE_ALL_EVENTS);} }

该函数处理了许多工作&＃xff0c;其中一项便是遍历发送任务队列&＃xff0c;并将 client 发送缓存区中的处理结果通过 write 发送到客户端手中。

我们来看下 beforeSleep 的实际源码。

//file:src/server.c void beforeSleep(struct aeEventLoop *eventLoop) {......handleClientsWithPendingWrites(); }

//file:src/networking.c int handleClientsWithPendingWrites(void) {listIter li;listNode *ln;int processed &＃61; listLength(server.clients_pending_write);//遍历写任务队列 server.clients_pending_writelistRewind(server.clients_pending_write,&li);while((ln &＃61; listNext(&li))) {client *c &＃61; listNodeValue(ln);c->flags &&＃61; ~CLIENT_PENDING_WRITE;listDelNode(server.clients_pending_write,ln);//实际将 client 中的结果数据发送出去writeToClient(c->fd,c,0)//如果一次发送不完则准备下一次发送if (clientHasPendingReplies(c)) {//注册一个写事件处理器&＃xff0c;等待 epoll_wait 发现可写后再处理 aeCreateFileEvent(server.el, c->fd, ae_flags,sendReplyToClient, c);}......} }

在 handleClientsWithPendingWrites 中&＃xff0c;遍历了发送任务队列 server.clients_pending_write&＃xff0c;并调用 writeToClient 进行实际的发送处理。

值得注意的是&＃xff0c;发送 write 并不总是能一次性发送完的。假如要发送的结果太大&＃xff0c;而系统为每个 socket 设置的发送缓存区又是有限的。

在这种情况下&＃xff0c;clientHasPendingReplies 判断仍然有未发送完的数据的话&＃xff0c;就需要注册一个写事件处理函数到 epoll 上。等待 epoll 发现该 socket 可写的时候再次调用 sendReplyToClient进行发送。

//file:src/networking.c int writeToClient(int fd, client *c, int handler_installed) {while(clientHasPendingReplies(c)) {// 先发送固定缓冲区if (c->bufpos > 0) {nwritten &＃61; write(fd,c->buf&＃43;c->sentlen,c->bufpos-c->sentlen);if (nwritten <&＃61; 0) break;......// 再发送回复链表中数据} else {o &＃61; listNodeValue(listFirst(c->reply));nwritten &＃61; write(fd, o->buf &＃43; c->sentlen, objlen - c->sentlen);......}} }

writeToClient 中的主要逻辑就是调用 write 系统调用让内核帮其把数据发送出去即可。由于每个命令的处理结果大小是不固定的。所以 Redis 采用的做法用固定的 buf &＃43; 可变链表来储存结果字符串。这里自然发送的时候就需要分别对固定缓存区和链表来进行发送了。

四、高性能 Redis 网络原理总结

Redis 服务器端只需要单线程可以达到非常高的处理能力&＃xff0c;每秒可以达到数万 QPS 的高处理能力。如此高性能的程序其实就是对 Linux 提供的多路复用机制 epoll 的一个较为完美的运用而已。

在 Redis 源码中&＃xff0c;核心逻辑其实就是两个&＃xff0c;一个是 initServer 启动服务&＃xff0c;另外一个就是 aeMain 事件循环。把这两个函数弄懂了&＃xff0c;Redis 就吃透一大半了。

//file: src/server.c int main(int argc, char **argv) {......// 启动初始化initServer();// 运行事件处理循环&＃xff0c;一直到服务器关闭为止aeMain(server.el); }

在 initServer 这个函数内&＃xff0c;Redis 做了这么三件重要的事情。

创建一个 epoll 对象
对配置的监听端口进行 listen
把 listen socket 让 epoll 给管理起来

在 aeMain 函数中&＃xff0c;是一个无休止的循环&＃xff0c;它是 Redis 中最重要的部分。在每一次的循环中&＃xff0c;要做的事情可以总结为如下图。

通过 epoll_wait 发现 listen socket 以及其它连接上的可读、可写事件
若发现 listen socket 上有新连接到达&＃xff0c;则接收新连接&＃xff0c;并追加到 epoll 中进行管理
若发现其它 socket 上有命令请求到达&＃xff0c;则读取和处理命令&＃xff0c;把命令结果写到缓存中&＃xff0c;加入写任务队列
每一次进入 epoll_wait 前都调用 beforesleep 来将写任务队列中的数据实际进行发送

其实事件分发器还处理了一个不明显的逻辑&＃xff0c;那就是如果 beforesleep 在将结果写回给客户端的时候&＃xff0c;如果由于内核 socket 发送缓存区过小而导致不能一次发送完毕的时候&＃xff0c;也会注册一个写事件处理器。等到 epoll_wait 发现对应的 socket 可写的时候&＃xff0c;再执行 write 写处理。

整个 Redis 的网络核心模块就在咱们这一篇文章中都叙述透了&＃xff08;剩下的 Redis 就是对各种数据结构的建立和处理了&＃xff09;。相信吃透这一篇对于你对网络编程的理解会有极大的帮助&＃xff01;

还等什么&＃xff0c;快把这篇文章也分享给你身边和你一样爱好深度技术的好友吧&＃xff01;

推荐阅读

python
Python高级之网络编程及TCP/IP协议簇的OSI七层模型介绍

本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容，主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]

蜡笔小新 2023-12-14 18:16:27
python
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
get
Web学习历程记录（七）——Tomcat基本概念和配置

本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念，以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器，包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实，适合初学者了解Tomcat的基础知识。 ... [详细]

蜡笔小新 2023-12-13 17:08:24
get
Linux如何安装Mongodb的详细步骤和注意事项

本文介绍了Linux如何安装Mongodb的详细步骤和注意事项，同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库，适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作，能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]

蜡笔小新 2023-12-12 21:54:15
数组
深入理解Kafka服务端请求队列中请求的处理

本文深入分析了Kafka服务端请求队列中请求的处理过程，详细介绍了请求的封装和放入请求队列的过程，以及处理请求的线程池的创建和容量设置。通过场景分析、图示说明和源码分析，帮助读者更好地理解Kafka服务端的工作原理。 ... [详细]

蜡笔小新 2023-12-12 16:14:59
python
恶意软件分析的最佳编程语言及其应用

本文介绍了学习恶意软件分析和逆向工程领域时最适合的编程语言，并重点讨论了Python的优点。Python是一种解释型、多用途的语言，具有可读性高、可快速开发、易于学习的特点。作者分享了在本地恶意软件分析中使用Python的经验，包括快速复制恶意软件组件以更好地理解其工作。此外，作者还提到了Python的跨平台优势，使得在不同操作系统上运行代码变得更加方便。 ... [详细]

蜡笔小新 2023-12-10 18:39:23
default
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
bash
Hyperledger Fabric外部链码构建与运行的开发笔记

本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识，包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性，外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍，读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行，并且不再受限于特定的语言和部署环境。 ... [详细]

蜡笔小新 2023-12-13 21:47:39
bash
图解redis的持久化存储机制RDB和AOF的原理和优缺点

本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件，恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘，实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点，帮助读者更好地理解redis的持久化存储策略。 ... [详细]

蜡笔小新 2023-12-13 20:24:11
bash
Voicewo在线语音识别转换jQuery插件的特点和示例

本文介绍了一款名为Voicewo的在线语音识别转换jQuery插件，该插件具有快速、架构、风格、扩展和兼容等特点，适合在互联网应用中使用。同时还提供了一个快速示例供开发人员参考。 ... [详细]

蜡笔小新 2023-12-13 20:01:16
bash
高校天文共享平台开发过程中的思考与规划

本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面，并总结了项目存在的问题，如前后端未分离、代码混乱等。作者表示希望通过记录和规划，能够理清思路，进一步完善该平台。 ... [详细]

蜡笔小新 2023-12-13 18:08:58
utf-8
XML介绍与使用的概述及标签规则

本文介绍了XML的基本概念和用途，包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则，包括标签的尖括号和合法标识符的组成，标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读，读者可以对XML的基本知识有一个全面的了解。 ... [详细]

蜡笔小新 2023-12-13 17:39:50
utf-8
如何在服务器主机上实现文件共享的方法和工具

本文介绍了在服务器主机上实现文件共享的方法和工具，包括Linux主机和Windows主机的文件传输方式，Web运维和FTP/SFTP客户端运维两种方式，以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外，还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK，以及主机迁移服务会收集的源端服务器信息。 ... [详细]

蜡笔小新 2023-12-13 13:23:48
utf-8
Redis的RDB文件与AOF文件的保存与还原机制

本文介绍了Redis中RDB文件和AOF文件的保存和还原机制。RDB文件用于保存和还原Redis服务器所有数据库中的键值对数据，SAVE命令和BGSAVE命令分别用于阻塞服务器和由子进程执行保存操作。同时执行SAVE命令和BGSAVE命令，以及同时执行两个BGSAVE命令都会产生竞争条件。服务器会保存所有用save选项设置的保存条件，当满足任意一个保存条件时，服务器会自动执行BGSAVE命令。此外，还介绍了RDB文件和AOF文件在操作方面的冲突以及同时执行大量磁盘写入操作的不良影响。 ... [详细]

蜡笔小新 2023-12-12 08:51:10
utf-8
从零基础到精通的前台学习路线

随着互联网的发展，前台开发工程师成为市场上非常抢手的人才。本文介绍了从零基础到精通前台开发的学习路线，包括学习HTML、CSS、JavaScript等基础知识和常用工具的使用。通过循序渐进的学习，可以掌握前台开发的基本技能，并有能力找到一份月薪8000以上的工作。 ... [详细]

蜡笔小新 2023-12-10 20:05:15

NethJ

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章