《Linux高性能服务器编程》阅读笔记:
1. TCP通信的读写(收发)接口
因为”Linux系统上”一切皆是文件”,那么自然读写文件用的API read()/write()同样适用于socket。不过Linux还提供了几个专门用于socket数据读写的系统调用。
#include
#include
ssize_t recv(int sockfd, void *buf, size_t len, int flags);
ssize_t send(int sockfd, const void *buf, size_t len, int flags);
recv()用于读取sockfd上的数据,buf和len参数分别指定读缓冲区的位置和大小,flags参数用于数据收发的额外控制,通常设置为0。
函数执行成功返回实际读取到的数据的长度,它可能小于程序员所期望的长度len。待读取的数据大于len时需要多次调用recv()才能完整读取,被读取过后的数据,将会在内核空间的接收缓冲区清除。recv()可能返回0,即对端已经关闭连接,出错则返回-1并设置errno。
send()用于往sockfd写入数据,buf和len参数分别指定写缓冲区的位置和大小。send()成功时返回实际写入的数据的长度,失败则返回-1并设置errno。
需要注意的是,send()实际是将应用程序的数据拷贝到内核的TCP模块的发送缓冲区,发往网络连接的具体实现是在系统内核。所以send()返回成功的情况下,也不能证明数据就一定发送成功。
flag参数的可选值有:
flags参数只对send()/recv()的当前调用有效,要永久性的保持有效需要使用setsockopt()系统调用修改socket的属性。
2. 带外数据的收发
带外数据即紧急数据,在TCP协议–带外数据和超时重传一文中有介绍。下面直接看代码。
服务端(接收)代码:
#include
#include
#include
#include
#include
#include
#include
#include #define ERRP(con, ret, ...) do \
{ \if (con) \{ \perror(__VA_ARGS__); \ret; \} \
}while(0)#define BUFSIZE 1024
static char isstop = 0;int main(int argc, char** argv)
{if (argc <&#61; 2){printf("usage: %s ip_address port number backlog\n", basename(argv[0]));return -1;}const char* ip &#61; argv[1];int port &#61; atoi(argv[2]);int backlog &#61; 5;int socket_fd &#61; socket(AF_INET, SOCK_STREAM, 0);ERRP(socket_fd <&#61; 0, return -1, "socket");struct sockaddr_in address;bzero(&address, sizeof(address));address.sin_family &#61; AF_INET;inet_pton(AF_INET, ip, &address.sin_addr);address.sin_port &#61; htons(port);int ret &#61; bind(socket_fd, (struct sockaddr* )&address, sizeof(address));ERRP(ret <0, return -1, "connect");ret &#61; listen(socket_fd, backlog);ERRP(ret <0, return -1, "listen");struct sockaddr_in client;socklen_t client_addrlen &#61; sizeof(client);int connfd &#61; accept(socket_fd, (struct sockaddr* )&client, &client_addrlen);ERRP(connfd <0, return -1, "accept");printf("connect success: %s:%d\n", inet_ntoa(client.sin_addr), ntohs(client.sin_port));char buffer[BUFSIZE] &#61; {};memset(buffer, 0, BUFSIZE);ret &#61; recv(connfd, buffer, BUFSIZE - 1, 0);printf("got %d bytes of normal data: \"%s\"\n", ret, buffer); close(socket_fd);return 0;
}
客户端(发送)代码&#xff1a;
int main(int argc, char** argv)
{if (argc <&#61; 2){printf("usage: %s ip_address port number backlog\n", basename(argv[0]));return -1;}const char* ip &#61; argv[1];int port &#61; atoi(argv[2]);int backlog &#61; 5;int socket_fd &#61; socket(AF_INET, SOCK_STREAM, 0);ERRP(socket_fd <&#61; 0, return -1, "socket");struct sockaddr_in address;bzero(&address, sizeof(address));address.sin_family &#61; AF_INET;inet_pton(AF_INET, ip, &address.sin_addr);address.sin_port &#61; htons(port);int ret &#61; connect(socket_fd, (struct sockaddr* )&address, sizeof(address));ERRP(ret <0, return -1, "connect");getchar();const char* oob_data &#61; "abcd";const char* normal_data &#61; "1234";send(socket_fd, normal_data, strlen(normal_data), 0);send(socket_fd, normal_data, strlen(normal_data), 0);send(socket_fd, normal_data, strlen(normal_data), 0);send(socket_fd, normal_data, strlen(normal_data), 0);getchar(); close(socket_fd);return 0;
}
如上程序是发送正常数据的代码。运行结果&#xff1a;
可见&#xff0c;即使发送端的数据分次发送&#xff0c;接收端也是一次性能读出。由于发送端没有发送带外数据&#xff0c;所以接收端以获取带外数据(MSG_OOB)时是失败返回的(-1)。接收端再次读取普通数据时会阻塞&#xff0c;因为接收缓冲区为空&#xff0c;阻塞直到发送端退出&#xff0c;此时接收端的阻塞读会返回0&#xff0c;表示对端已经退出。
将发送端中向服务端发送数据代码片段的发送的是带外数据取消注释后&#xff0c;即向接收端发送带外数据&#xff0c;运行结果:
可见&#xff0c;发送端发送的4字节的带外数据”abcd”仅最后一个字符’d’被接收端当成真正的带外数据接收&#xff0c;并且接收端对普通数据的接收会被带外数据截断。所以在带外数据接收之后还能接收到被截断后半部分的数据。
我们还可以在这个通信过程中用tcpdump捕获双方通信的数据包&#xff1a;
$ sudo tcpdump -ntx -i lo port 9660
跟数据的收发相关报文段如下&#xff1a;
(1) IP 192.168.239.136.44090 > 192.168.239.136.9660: Flags [P.], seq 1:5, ack 1, win 342, options [nop,nop,TS val 1538099 ecr 1535016], length 4
(2) IP 192.168.239.136.44090 > 192.168.239.136.9660: Flags [P.U], seq 5:13, ack 1, win 342, urg 8, options [nop,nop,TS val 1538099 ecr 1535016], length 8
(3) IP 192.168.239.136.44090 > 192.168.239.136.9660: Flags [P.], seq 13:17, ack 1, win 342, options [nop,nop,TS val 1538099 ecr 1535016], length 4
(3) IP 192.168.239.136.44090 > 192.168.239.136.9660: Flags [P.], seq 13:17, ack 1, win 342, options [nop,nop,TS val 1538099 ecr 1535016], length 4
(4) IP 192.168.239.136.44090 > 192.168.239.136.9660: Flags [P.], seq 17:21, ack 1, win 342, options [nop,nop,TS val 1538099 ecr 1535016], length 4
(1) 报文段1是普通数据&#xff0c;即”1234”。
(2) 报文段2是普通数据”1234”和带外数据”abcd”&#xff0c;这两份数据虽然是在发送端分两次发送&#xff0c;但是被内核优化成1次发送。注意&#xff0c;U标志表示该TCP报文段的头部被设置了紧急标志。urg 8是紧急偏移值&#xff0c;它指出带外数据在完整字节流的位置是13(8 &#43; 5, 5是TCP报文段的序号值相对于初始序号值的偏移)&#xff0c;因此带外数据是完整字节流中的第12字节&#xff0c;即字符’d’。
在实际应用中&#xff0c;接收端通常无法预期带外数据何时到来&#xff0c;而Linux内核在检测到TCP紧急标志时&#xff0c;可以有两种方式通知应用程序带外数据的到来: I/O复用产生的异常事件(如select()&#xff0c;其参数三exceptfds就是存放用于检测异常事件的描述符)和SIGURG信号&#xff0c;应有程序在知道有带外数据后&#xff0c;调用sockatmark()函数来定位到具体位置&#xff1a;
#include
int sockatmark(int sockfd);
sockatmark()判断sockfd是否处于带外标记&#xff0c;即下一个被读取到的数据是否为带外数据&#xff0c;若不是则返回0&#xff1b;若是返回1&#xff0c;此时再利用带MSG_OOB的标志的recv()函数来接收带外数据。
另外&#xff0c;补充一点&#xff0c;当对端close()通信连接时&#xff0c;若本端接着发送数据&#xff0c;根据TCP协议的规定&#xff0c;对端会收到一个RST复位报文&#xff0c;如果本端再往对端发送数据时&#xff0c;本端系统就会产生一个SIGPIPE信号。SIGPIPE信号默认会使得应用程序退出&#xff0c;程序员可以通过signal()系统调用设置该信号的具体行为。