5-4 listen()队列剖析、阻塞非阻塞、同步异步

文章目录

一：listen()队列剖析

（1.1）监听套接字的队列
（1.2）accept()函数
（1.3）syn攻击【syn flood】:典型的利用TCP/IP协议涉及弱点进行坑爹的一种行为；

二：阻塞与非阻塞I/O

a)阻塞I/O
b)非阻塞I/O：不会卡住，充分利用时间片，执行更高；

三：同步与异步I/O:这两个概念容易和阻塞/非阻塞混淆；

a)异步I/O：调用一个异步I/O函数时，我门要给这个函数指定一个接收缓冲区，我还要给定一个回调函数；
b)同步I/O
（3.1）I / O复用
（3.2）思考题

一：listen()队列剖析

listen()：监听端口，用在 TCP连接中的服务器端角色；
listen()函数调用格式：
int listen(int sockfd, int backlog);
要理解好backlog这个参数，我们需要先谈一谈 “监听套接字队列”的话题；

（1.1）监听套接字的队列

对于一个调用listen()进行监听的套接字，操作系统会给这个套接字维护两个队列；
a)未完成连接队列【保存连接用的】
当客户端发送tcp连接三次握手的第一次【syn包】给服务器的时候，服务器就会在未完成队列中创建一个跟这个 syn包对应的一项，
其实，我们可以把这项看成是一个半连接【因为连接还没建立起来呢】，这个半连接的状态会从LISTEN变成SYN_RCVD状态，同时给客户端返回第二次握手包【syn,ack】
这个时候，其实服务器是在等待完成第三次握手；

b)已完成连接队列【保存连接用的】
当第三次握手完成了，这个连接就变成了ESTABLISHED状态，每个已经完成三次握手的客户端都放在这个队列中作为一项；
backlog曾经的含义：已完成队列和未完成队列里边条目之和不能超过 backlog;
(1)客户端这个connect()什么时候返回，其实是收到三次握手的第二次握手包（也就是收到服务器发回来的syn/ack）之后就返回了；
(2)RTT是未完成队列中任意一项在未完成队列中留存的时间，这个时间取决于客户端和服务器；
对于客户端，这个RTT时间是第一次和第二次握手加起来的时间；
对于服务器，这个RTT时间实际上是第二次和第三次握手加起来的时间；
如果这三次握手包传递速度特别快的话，大概187毫秒能够建立起来这个连接；这个时间挺慢，所以感觉建立TCP连接的成本挺高；【短连接游戏-挺恶心的】
(3)如果一个恶意客户，迟迟不发送三次握手的第三个包。那么这个连接就建立不起来，那么这个处于SYN_RCVD的这一项【服务器端的未完成队列中】，
//就会一致停留在服务器的未完成队列中，这个停留时间大概是75秒，如果超过这个时间，这一项会被操作系统干掉；

（1.2）accept()函数

accept()函数，就使用来从已完成连接队列中的队首【队头】位置取出来一项【每一项都是一个已经完成三路握手的TCP连接】，返回给进程；
如果已完成连接队列是空的呢？那么咱们这个范例中accept()会一致卡在这里【休眠】等待，一直到已完成队列中有一项时才会被唤醒；
所以，从编程角度，我们要尽快的用accept()把已完成队列中的数据【TCP连接】取走，大家必须有这个认识；
accept()返回的是个套接字，这个套接字就代表那个已经用三次握手建立起来的那个tcp连接，因为accept()是从已完成队列中取的数据；
换句话来说，我们服务器程序，必须要严格区分两个套接字：
a)监听9000端口这个套接字，这个东西叫“监听套接字【listenfd】”，只要服务器程序在运行，这个套接字就应该一直存在；
b)当客户端连接进来，操作系统会为每个成功建立三次握手的客端再创建一个套接字【当然是一个已经连接套接字】，accept()返回的就是这种套接字；
也就是从已完成连接队列中取得的一项。随后，服务器使用这个accept()返回的套接字和客户端通信的；

思考题：
(1)如果两个队列之和【已完成连接队列，和未完成连接队列】达到了listen()所指定的第二参数，也就是说队列满了；
此时，再有一个客户发送syn请求，服务器怎么反应？
实际上服务器会忽略这个syn，不给回应；客户端这边，发现syn没回应，过一会会重发syn包；
(2)从连接被扔到已经完成队列中去，到accept()从已完成队列中把这个连接取出这个之间是有个时间差的，如果还没等accept()从
已完成队列中把这个连接取走的时候，客户端如果发送来数据，这个数据就会被保存再已经连接的套接字的接收缓冲区里，这个缓冲区有多大，最大就能接收多少数据量；

（1.3）syn攻击【syn flood】:典型的利用TCP/IP协议涉及弱点进行坑爹的一种行为；

拒绝服务攻击(DOS/DDOS)；
backlog：进一步明确和规定了：指定给定套接字上内核为之排队的最大已完成连接数【已完成连接队列中最大条目数】；
大家在写代码时尽快用accept()把已完成队列里边的连接取走，尽快留出空闲为止给后续的已完成三路握手的条目用，那么这个已完成队列一般不会满；
一般这个backlog值给300左右；

二：阻塞与非阻塞I/O

阻塞和非阻塞主要是指调用某个系统函数时，这个函数是否会导致我们的进程进入sleep()【卡在这休眠】状态而言的；

a)阻塞I/O

我调用一个函数，这个函数就卡在在这里，整个程序流程不往下走了【休眠sleep】，该函数卡在这里等待一个事情发生，只有这个事情发生了，这个函数才会往下走；
这种函数，就认为是阻塞函数；accept();
这种阻塞，并不好，效率很低；一般我们不会用阻塞方式来写服务器程序，效率低；

b)非阻塞I/O：不会卡住，充分利用时间片，执行更高；

非阻塞模式的两个鲜明特点：
(1)不断的调用accept(),recvfrom()函数来检查有没有数据到来，如果没有，函数会返回一个特殊的错误标记来告诉你，这种标记可能是EWULDBLOCK，也可能是EAGAIN；如果数据没到来，那么这里有机会执行其他函数，但是也得不停的再次调用accept(),recvfrom()来检查数据是否到来，非常累；
(2)如果数据到来，那么就得卡在这里把数据从内核缓冲区复制到用户缓冲区，所以复制这个阶段是卡着完成的；

三：同步与异步I/O:这两个概念容易和阻塞/非阻塞混淆；

a)异步I/O：调用一个异步I/O函数时，我门要给这个函数指定一个接收缓冲区，我还要给定一个回调函数；

调用完一个异步I/O函数后，该函数会立即返回。其余判断交给操作系统，操作系统会判断数据是否到来，如果数据到来了，操作系统会把数据拷贝到你所提供的缓冲区里，然后调用你所指定的这个回调函数来通知你；
很容易区别非阻塞和异步I/O的差别：
（1）非阻塞I/O要不停的调用I/O函数来检查数据是否来，如果数据来了，就得卡在I/O函数这里把数据从内核缓冲区复制到用户缓冲区，然后这个函数才能返回；
（2）异步I/O根本不需要不停的调用I/O函数来检查数据是否到来，只需要调用一次，然后就可以干别的事情去了；
内核判断数据到来，拷贝数据到你提供的缓冲区，调用你的回调函数来通知你，你并没有被卡在那里的情况；

b)同步I/O

select/poll。epoll。
1)调用select()判断有没有数据，有数据，走下来，没数据卡在那里；
2)select()返回之后，用recvfrom()去取数据；当然取数据的时候也会卡那么一下；
同步I/O感觉更麻烦，要调用两个函数才能把数据拿到手；
但是同步I/O和阻塞式I/O比，就是所谓的 I/O复用【用两个函数来收数据的优势】能力；

（3.1）I / O复用

所谓I/O复用，就是我多个socket【多个TCP连接】可以弄成一捆【一堆】，我可以用select这种同步I/O函数在这等数据；
select()的能力是等多条TCP连接上的任意一条有数据来；，然后哪条TCP有数据来，我再用具体的比如recvfrom()去收。
所以，这种调用一个函数能够判断一堆TCP连接是否来数据的这种能力，叫I/O复用，英文I/O multiplexing【I/O多路复用】

很多资料把阻塞I/O，非阻塞I/O，同步I/O归结为一类，因为他们多多少少的都有阻塞的行为发生；
甚至有的资料直接就把阻塞I/O，非阻塞I/O 都归结为同步I/O模型，这也是可以的】
而把异步I/O单独归结为一类，因为异步I/O是真正的没有阻塞行为发生的；

（3.2）思考题

什么叫用异步的方法去使用非阻塞调用？

昔拉天使

发布了358 篇原创文章 · 获赞 191 · 访问量 2万+

私信关注