当前位置: 开发笔记 > 编程语言 > 正文

01LinuxIO模型

作者：遥不V可及 | 来源：互联网 | 2023-07-21 03:40

文章目录LinuxIO模型一、IO模型分类1.1分类标准1.2blocking和non-blocking的区别1.3同步IO和异步IO的区别二、几种IO模型对比2.1Blockin

文章目录

Linux IO模型
- 一、IO模型分类
- - 1.1 分类标准
  - 1.2 blocking和non-blocking的区别
  - 1.3 同步IO和异步IO的区别
- 二、几种IO模型对比
- - 2.1 Blocking IO(使用广泛)
  - 2.2 非阻塞 I/O&＃xff08;nonblocking IO&＃xff0c;浪费 CPU使用很少&＃xff09;
  - 2.3 I/O 多路复用&＃xff08; IO multiplexing&＃xff0c;广泛使用&＃xff09;
  - 2.4 信号驱动I/O
  - 2.5 异步 I/O&＃xff08;asynchronous IO&＃xff09;
  - 2.6 对比
- 三、I/O 多路复用之select、poll、epoll详解
- - 3.1 select
  - 3.2 poll
  - 3.3 epoll
- 四、参考

Linux IO模型

一、IO模型分类

1.1 分类标准

一次IO可以分为两个阶段&＃xff0c;等待数据准备阶段和数据拷贝阶段。第一阶段将数据加载到内核空间。但是有可能数据没有准备好&＃xff0c;比如等待对方的数据或者等待缓冲区被写满&＃xff0c;第二阶段就是将准备好的数据从内核空间拷贝到用户进程(用户进程是不能直接访问硬件对应缓冲区的&＃xff0c;比如网络IO缓冲区&＃xff0c;因此需要将数据从内核拷贝到用户进程)
第一阶段&＃xff1a;如果等待期间数据没有准备好能够直接返回&＃xff0c;就是非阻塞的&＃xff0c;如果需要等待直到数据准备好那就是阻塞的。
第二阶段&＃xff1a;如果这个数据拷贝阶段是用户程序自己完成&＃xff0c;那就是同步的&＃xff0c;如果这个拷贝过程是操作系统完成&＃xff0c;拷贝完成之后给用户程序一个通知&＃xff0c;那就是异步的。
按照这两个阶段&＃xff0c;理论上有四种模型&＃xff0c;阻塞同步、阻塞异步、非阻塞同步和非阻塞异步。不过Linux系统下有5种网络模型&＃xff0c;前面的四种并非每一种类型都有实现&＃xff0c;对应如下&＃xff1a;

1.阻塞 I/O&＃xff08;blocking IO&＃xff09; -- 阻塞同步 2.非阻塞 I/O&＃xff08;nonblocking IO&＃xff09;-- 非阻塞同步 3.I/O 多路复用&＃xff08; IO multiplexing&＃xff09; -- 非阻塞同步 4.信号驱动 I/O&＃xff08; signal driven IO&＃xff09; -- 非阻塞同步 5.异步 I/O&＃xff08;asynchronous IO&＃xff09;-- 非阻塞异步

1.2 blocking和non-blocking的区别

从前面非分类标准可以看出&＃xff0c;阻塞IO和非阻塞IO的区别在于&＃xff0c;在内核准备数据阶段(可能数据尚未到达&＃xff0c;或者等待缓冲区被写满)&＃xff0c;阻塞IO会阻塞等待直到数据准备好(其实后面的数据拷贝到用户进程的阶段也是阻塞的)&＃xff0c;非阻塞IO在准备数据阶段则会直接返回。

1.3 同步IO和异步IO的区别

区别在于IO操作的时候是否被阻塞&＃xff0c;这个IO操作是指第二阶段将数据从内核拷贝到用户程序&＃xff0c;在Linux中是recvfrom这个系统调用完成这个步骤。对于同步IO在这个拷贝阶段用户进程是阻塞的&＃xff0c;而异步IO则不会阻塞&＃xff0c;异步IO发起操作之后直接返回就不管了&＃xff0c;直到内核拷贝数据完成之后返回一个通知告诉进程完成了&＃xff0c;整个过程用户进程不被阻塞。

二、几种IO模型对比

2.1 Blocking IO(使用广泛)

在linux中&＃xff0c;默认情况下所有的socket都是blocking&＃xff0c;一个典型的读操作流程大概是这样&＃xff1a;

在这里插入图片描述

当用户进程调用了recvfrom或者read这个系统调用&＃xff0c;kernel就开始了IO的第一个阶段&＃xff1a;准备数据&＃xff08;对于网络IO来说&＃xff0c;很多时候数据在一开始还没有到达。比如&＃xff0c;还没有收到一个完整的UDP包。这个时候kernel就要等待足够的数据到来&＃xff09;。这个过程需要等待&＃xff0c;也就是说数据被拷贝到操作系统内核的缓冲区中是需要一个过程的。而在用户进程这边&＃xff0c;整个进程会被阻塞&＃xff08;当然&＃xff0c;是进程自己选择的阻塞&＃xff09;。当kernel一直等到数据准备好了&＃xff0c;它就会将数据从kernel中拷贝到用户内存&＃xff0c;然后kernel返回结果&＃xff0c;用户进程才解除block的状态&＃xff0c;重新运行起来。
所以&＃xff0c;blocking IO的特点就是在IO执行的两个阶段都被block了,用户线程会一直阻塞直到有数据并一直到数据拷贝到用户空间。。

2.2 非阻塞 I/O&＃xff08;nonblocking IO&＃xff0c;浪费 CPU使用很少&＃xff09;

linux下&＃xff0c;可以通过设置socket使其变为non-blocking。就是告诉内核&＃xff0c;当请求的I/O操作无法完成时&＃xff0c;不要将进程睡眠&＃xff0c;而是返回一个错误。当对一个non-blocking socket执行读操作时&＃xff0c;流程是这个样子&＃xff1a;

在这里插入图片描述

当用户进程发出recvfrom操作时&＃xff0c;如果kernel中的数据还没有准备好&＃xff0c;那么它并不会block用户进程&＃xff0c;而是立刻返回一个error。从用户进程角度讲&＃xff0c;它发起一个recvfrom操作后&＃xff0c;并不需要等待&＃xff0c;而是马上就得到了一个结果。用户进程判断结果是一个error时&＃xff0c;它就知道数据还没有准备好&＃xff0c;于是它可以再次发送recvfrom操作。一旦kernel中的数据准备好了&＃xff0c;并且又再次收到了用户进程的system call&＃xff0c;那么它马上就将数据拷贝到了用户内存&＃xff0c;然后返回。所以&＃xff0c;non-blocking IO的特点是用户进程需要不断的主动询问kernel数据好了没有。
这种IO模式用户线程需要不断的去探测数据是否准备好 &＃xff0c;比较浪费CPU资源

2.3 I/O 多路复用&＃xff08; IO multiplexing&＃xff0c;广泛使用&＃xff09;

IO multiplexing就是我们说的select&＃xff0c;poll&＃xff0c;epoll&＃xff0c;他们是实现IO多路复用的基础。这几个函数也是会使进程阻塞的&＃xff0c;但是和阻塞IO不同的是&＃xff0c;他们不会阻塞在某一个IO操作&＃xff0c;可以阻塞多个IO操作&＃xff0c;可以同时对多个读写的IO函数进行检测&＃xff0c;直到有数据读写才调用系统的IO调用。比如前面的阻塞IO&＃xff0c;它只能检测一个IO操作&＃xff0c;如果数据没准备好就只能等着。但是这几个函数它可以检测N个&＃xff0c;如果N个IO操作都没有准备好&＃xff0c;那么就会阻塞&＃xff0c;但是N个IO里面只要有至少一个可以进行读写&＃xff0c;则会返回。有些地方也称这种IO方式为event driven IO。
select/epoll的好处就在于单个process就可以同时处理多个网络连接的IO。它的基本原理就是select&＃xff0c;poll&＃xff0c;epoll这个function会不断的轮询所负责的所有socket&＃xff0c;当某个socket有数据到达了&＃xff0c;就通知用户进程。

在这里插入图片描述

当用户进程调用了select&＃xff0c;那么整个进程会被block&＃xff0c;而同时&＃xff0c;kernel会“监视”所有select负责的socket&＃xff0c;当任何一个socket中的数据准备好了&＃xff0c;select就会返回。这个时候用户进程再调用read操作&＃xff0c;将数据从kernel拷贝到用户进程。所以&＃xff0c;I/O多路复用的特点是通过一种机制一个进程能同时等待多个文件描述符&＃xff0c;而这些文件描述符&＃xff08;套接字描述符&＃xff09;其中的任意一个进入读就绪状态&＃xff0c;select()函数就可以返回。
这个图和blocking IO的图其实并没有太大的不同&＃xff0c;事实上&＃xff0c;还更差一些。因为这里需要使用两个system call (select 和 recvfrom)&＃xff0c;而blocking IO只调用了一个system call (recvfrom)。但是&＃xff0c;用select的优势在于它可以同时处理多个connection。所以&＃xff0c;如果处理的连接数不是很高的话&＃xff0c;使用select/epoll的web server不一定比使用
multi-threading &＃43; blocking IO的web server性能更好&＃xff0c;可能延迟还更大。select/epoll的优势并不是对于单个连接能处理得更快&＃xff0c;而是在于能处理更多的连接。&＃xff09;
在IO multiplexing Model中&＃xff0c;实际中&＃xff0c;对于每一个socket&＃xff0c;一般都设置成为non-blocking&＃xff0c;但是&＃xff0c;如上图所示&＃xff0c;整个用户的process其实是一直被block的。只不过process是被select这个函数block&＃xff0c;而不是被socket IO给block。

2.4 信号驱动I/O

允许SOCKET接口进行信号驱动I/O,并注册一个信号处理函数&＃xff0c;进程继续运行并不阻塞。当数据准备好时&＃xff0c;进程会收到一个SIGIO信号&＃xff0c;可以在信号处理函数中调用I/O操作函数处理数据

在这里插入图片描述

2.5 异步 I/O&＃xff08;asynchronous IO&＃xff09;

Linux下的asynchronous IO其实用得很少。当一个异步过程调用发出后&＃xff0c;调用者不能立刻得到结果。实际处理这个调用的步骤在完成后&＃xff0c;通过状态、通知和回调来通知调用者的输入输出操作。先看一下它的流程&＃xff1a;

在这里插入图片描述

用户进程发起aio_read操作之后&＃xff0c;立刻就可以开始去做其它的事。而另一方面&＃xff0c;从kernel的角度&＃xff0c;当它受到一个asynchronous read之后&＃xff0c;首先它会立刻返回&＃xff0c;所以不会对用户进程产生任何block。然后&＃xff0c;kernel会等待数据准备完成&＃xff0c;然后将数据拷贝到用户内存&＃xff0c;当这一切都完成之后&＃xff0c;kernel会给用户进程发送一个signal&＃xff0c;告诉它read操作完成了。
异步操作整个过程都不需要用户进程参与&＃xff0c;发出信号之后做自己的事情&＃xff0c;等到内核把数据拷贝到用户空间之后&＃xff0c;给自己一个信号就完事了

2.6 对比

在这里插入图片描述

通过上面的图片&＃xff0c;可以发现non-blocking IO和asynchronous IO的区别还是很明显的。在non-blocking IO中&＃xff0c;虽然进程大部分时间都不会被block&＃xff0c;但是它仍然要求进程去主动的check&＃xff0c;并且当数据准备完成以后&＃xff0c;也需要进程主动的再次调用recvfrom来将数据拷贝到用户内存。而asynchronous IO则完全不同。它就像是用户进程将整个IO操作交给了他人&＃xff08;kernel&＃xff09;完成&＃xff0c;然后他人做完后发信号通知。在此期间&＃xff0c;用户进程不需要去检查IO操作的状态&＃xff0c;也不需要主动的去拷贝数据。

三、I/O 多路复用之select、poll、epoll详解

select&＃xff0c;poll&＃xff0c;epoll都是IO多路复用的机制。I/O多路复用就是通过一种机制&＃xff0c;让一个进程可以监视多个描述符&＃xff0c;一旦某个描述符就绪&＃xff08;一般是读就绪或者写就绪&＃xff09;&＃xff0c;能够通知程序进行相应的读写操作。select&＃xff0c;poll&＃xff0c;epoll本质上都是同步I/O&＃xff0c;因为他们都需要在读写事件就绪后自己负责进行读写&＃xff0c;也就是说这个读写过程是阻塞的&＃xff0c;而异步I/O则无需自己负责进行读写&＃xff0c;异步I/O的实现会负责把数据从内核拷贝到用户空间。

int select (int n, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);int poll (struct pollfd *fds, unsigned int nfds, int timeout);int epoll_create(int size)&＃xff1b;//创建一个epoll的句柄&＃xff0c;size用来告诉内核这个监听的数目一共有多大 int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)&＃xff1b; int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);

3.1 select

select 函数监视的文件描述符分3类&＃xff0c;分别是writefds、readfds、和exceptfds。调用后select函数会阻塞&＃xff0c;直到有描述符就绪&＃xff08;有数据可读、可写、或者有except&＃xff09;或者超时&＃xff08;timeout指定等待时间&＃xff0c;如果立即返回设为null即可&＃xff09;&＃xff0c;函数返回。当select函数返回后&＃xff0c;可以通过遍历fdset&＃xff0c;来找到就绪的描述符。
优点&＃xff1a;良好跨平台支持&＃xff1b;select目前几乎在所有的平台上支持
缺点&＃xff1a;单个进程能监视的FD数量存在最大限制&＃xff0c;Linux上一般为1024&＃xff0c;可通过修改宏定义甚至重新编译内核的方式提升这一限制&＃xff0c;但是这样也会造成效率的降低。

3.2 poll

pollfd结构包含了要监视的event和发生的event&＃xff0c;不再使用select“参数-值”传递的方式。同时&＃xff0c;poll fd并没有最大数量限制&＃xff08;但是数量过大后性能也是会下降&＃xff09;。和select函数一样&＃xff0c;poll返回后&＃xff0c;需要轮询poll fd来获取就绪的描述符。
从上面看&＃xff0c;select和poll都需要在返回后&＃xff0c;通过遍历文件描述符来获取已经就绪的socket。事实上&＃xff0c;同时连接的大量客户端在一时刻可能只有很少的处于就绪状态&＃xff0c;因此随着监视的描述符数量的增长&＃xff0c;其效率也会线性下降。

3.3 epoll

epoll是在2.6内核中提出的&＃xff0c;是之前的select和poll的增强版本。相对于select和poll来说&＃xff0c;epoll更加灵活&＃xff0c;没有描述符限制。epoll使用一个文件描述符管理多个描述符&＃xff0c;将用户关系的文件描述符的事件存放到内核的一个事件表中&＃xff0c;这样在用户空间和内核空间的copy只需一次。
epoll是通过回调的方式激活某个有事件的文件描述符&＃xff0c;而select和poll需要遍历所有的文件描述符来找到具有事件的文件描述符&＃xff0c;因此epoll比select和poll有非常大的性能提示&＃xff0c;select和pool在文件描述符过多的时候性能会下降明显&＃xff0c;epoll则不会。
优点&＃xff1a;epol最大的优点是监视的FD数量不受限制&＃xff0c;不过如果没有大量的idle -connection或者dead-connection&＃xff0c;epoll的效率并不会比select/poll高很多&＃xff0c;
但是当遇到大量的idle- connection&＃xff0c;就会发现epoll的效率大大高于select/poll&＃xff0c;也就是在FD很多&＃xff0c;但是同一时间活跃的FD并不多的时候&＃xff0c;epoll的效率会大大高于select和poll。

四、参考

select提高并发&＃xff0c;select和poll、epoll的区别
聊聊BIO&＃xff0c;NIO和AIO (1)
五种I/O模型

推荐阅读

copy
默认和非默认监听配置

一、如果使用默认的1521端口，让实例自动注册到该监听上，那么local_listener无需设置，listener.ora文件按照正常方 ... [详细]

蜡笔小新 2024-09-28 12:04:51
cmd
Linux命令Dig

一、域名解析记录说明记录类型A：用来指定域名的IPv4地址（如：8.8.8.8），如果需要将域名指向一个IP ... [详细]

蜡笔小新 2024-09-28 10:52:03
string
linux ipc——shared memory

1、概念共享内存：共享内存是进程间通信中最简单的方式之一。共享内存允许两个或更多进程访问同一块内存，就如同malloc()函数向不同进程返回了指向同一个 ... [详细]

蜡笔小新 2024-09-27 11:39:50
string
C10K问题,c1000k问题

为什么80%的码农都做不了架构师？#0系列目录#聊聊远程通信Java远程通讯技术及原理分析聊聊Socket、TCPIP、HTTP、FTP及网 ... [详细]

蜡笔小新 2024-09-26 18:02:26
string
Python高级之网络编程及TCP/IP协议簇的OSI七层模型介绍

本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容，主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]

蜡笔小新 2023-12-14 18:16:27
string
Mysql MySqlBulkLoader在.NET平台下的批量插入

批量导入publicboolTranBatchImpo ... [详细]

蜡笔小新 2024-09-30 10:20:25
copy
Android JNI学习之Concepts

2019独角兽企业重金招聘Python工程师标准ConceptsBeforeBeginningThisguideassumesthatyouare:Alreadyfamili ... [详细]

蜡笔小新 2024-09-27 09:16:45
copy
这是一份详细 & 清晰的计算机网络基础学习指南

前言计算机网络基础该是程序猿需掌握的知识，但往往会被忽略今天，我将献上一份详细&清晰的计算机网络基础学习指南，涵盖TCPUDP协议、Http协议、Socket等，希望你们会喜欢。目 ... [详细]

蜡笔小新 2024-09-26 15:47:23
copy
swoole是传统php多少倍,使用 Swoole 加速 Laravel

Swoole是针对PHP的生产级异步编程框架。它是一种用纯C语言编写的PHP扩展，它使PHP开发人员能够在PHP中编写高性能，可扩展的并发TCP ... [详细]

蜡笔小新 2024-09-26 12:16:29
filter
服务器性能优化之网络性能优化

hi，大家好，今天分享一篇后台服务器性能优 ... [详细]

蜡笔小新 2024-09-25 08:41:16
list
centos samba 看不到共享目录_samba共享服务

会不会有那么一天，生活可以简单到每天清早踏上一辆载着鲜花的脚踏车，微笑着穿过窄窄的街巷，为爱花的人送去芬芳，为需要知识的你送 ... [详细]

蜡笔小新 2024-09-24 19:02:39
string
TCP/IPLinux数据链路层的包解析

Linux数据链路层的包解析仅以此文作为学习笔记，初学者，如有错误欢迎批评指正，但求轻喷。一般而言，Linux系统截获数据包后，会通过协议栈，按照TCPIP层次进行解析，那我们如何 ... [详细]

蜡笔小新 2024-09-24 17:49:40
filter
Perl的测试框架Test::Base简介及使用方法

本文介绍了Perl的测试框架Test::Base，它是一个数据驱动的测试框架，可以自动进行单元测试，省去手工编写测试程序的麻烦。与Test::More完全兼容，使用方法简单。以plural函数为例，展示了Test::Base的使用方法。 ... [详细]

蜡笔小新 2023-12-13 20:05:31
filter
在Windows10系统上使用VMware创建CentOS虚拟机的详细步骤教程

本文详细介绍了在Windows10系统上使用VMware创建CentOS虚拟机的步骤，包括准备条件、安装VMware、下载CentOS ISO文件、创建虚拟机并进行自定义配置、设置虚拟机的ISO与网络、进行安装和配置等。通过本文的指导，读者可以轻松地创建自己的CentOS虚拟机并进行相应的配置和操作。 ... [详细]

蜡笔小新 2023-12-09 09:09:21
sum
使用FLASK REST API的机器学习模型

在本教程中，我们将看到如何使用FLASK制作第一个用于机器学习模型的RESTAPI。我们将从创建机器学习模型开始。然后，我们将看到使用Flask创建AP ... [详细]

蜡笔小新 2023-10-17 19:13:12

遥不V可及

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章