【网络协议】TCP协议常用机制——延迟应答、捎带应答、面向字节流、异常处理，保姆级详解，建议收藏

🕗 发布于 2024-10-12 22:52 网络协议 tcp/ip 网络网络编程 python

💐个人主页：初晴~

📚相关专栏：计算机网络那些事

前几篇文章，博主带大家梳理了一下TCP协议的几个核心机制，比如保证可靠性的确认应答、超时重传机制，和提高传输效率的滑动窗口及其相关优化机制。除此之外，TCP还有一些非常重要的核心机制，就让博主在本篇文章带着大家学习一下吧

一、延迟应答

TCP协议中的延时应答（Delayed Acknowledgment）机制是一种优化技术，旨在减少网络中的确认（ACK）消息数量，从而提高网络带宽利用率和减少网络拥塞。

试想一下，如果接收端在收到数据时就立马返回ACK应答可能会出现什么问题？

这时返回的窗口可能会比较小

假设接收端缓冲区为1M，⼀次收到了500K的数据，如果⽴刻应答，返回的窗⼝就是500K
但实际上可能处理端处理的速度很快，10ms之内就把500K数据从缓冲区消费掉了
在这种情况下，接收端处理还远没有达到⾃⼰的极限，即使窗⼝再放⼤⼀些, 也能处理过来
如果接收端稍微等⼀会再应答，⽐如等待200ms再应答，那么这个时候返回的窗⼝⼤⼩就是1M

主要原理是接收端在接收数据的时候，应用程序也在源源不断地消费接受缓冲区内的数据。

在收到数据时，先等一小会儿，缓冲区内的数据可能就会被消费而少掉很多，此时再返回给发送端 ACK时，返回的窗口大小就大概率会比立即返回更大。

而窗口越大，网络吞吐量就越大，传输效率也越高。因此延迟应答在一定程度上就能提高网络传输的效率。

但难道能一直延迟下去吗？延迟的时间过久也是会导致接受缓冲区爆满，引发丢包等一系列问题的。因此TCP会对延迟时间做出一些限制：

数量限制：每隔N个包就应答⼀次
时间限制：超过最⼤延迟时间就应答⼀次

具体的数量和超时时间，依操作系统不同也有差异。⼀般N取2，超时时间取200ms

这样就能很好地控制应答报文的返回密度，在不影响传输可靠性的条件下，尽可能提高网络传输的效率

二、捎带应答

在延迟应答的基础上，我们发现，实际网络通信中，大多数情况下都是“一问一答”的形式：

ack ，是系统内核返回的，在收到请求后就立即返回ack
响应，是应用程序返回的，在代码中，根据请求计算得到响应，然后再返回给发送端

正常情况下，ack与响应返回的时机不同，无法进行合并。

但别忘了，ack涉及“延时应答”机制，会让ack返回时间推迟。这一推迟，ack 就有机会等到响应报文生成的时候了，于是就可以再发送响应的时候，捎带上ack数据。

就好比说客⼾端给服务器说了 "How are you"，服务器也会给客⼾端回⼀个 "Fine, thank you"，而这个时候ack就等了一会儿，搭上顺风车，和服务器回应的 "Fine, thank you" 一起返回给客户端

还记得之前在 TCP协议“三次握手，四次挥手” 一文中我们研究过的四次挥手吗？

当时我们介绍过，ack是系统内核返回的，fin是应用程序返回的，理论上来说这俩发送时机并不同，是无法合并的。这也是“四次挥手”说法的由来。

但是，在延时应答的机制下，ack的返回时间可能会推迟，就有可能会和 FIN 合并，一起返回了。这时，“四次挥手” 就变成 “三次挥手” 了。

之所以ack可以和响应报文合并，是因为 ack 报文本身不需要载荷，只需在报头中将 ack字段设为“1”，接着设置好窗口大小、确认序号即可。这并不会与正常的响应报文产生冲突

三、面向字节流

创建⼀个TCP的socket, 同时在内核中创建⼀个发送缓冲区和⼀个接收缓冲区;

调⽤write时，数据会先写⼊发送缓冲区中
如果发送的字节数太⻓，会被拆分成多个TCP的数据包发出
如果发送的字节数太短，就会先在发送缓冲区⾥等待，等到缓冲区⻓度差不多了，或者其他合适的时机发送出去
接收数据的时候，数据也是从⽹卡驱动程序到达内核的接收缓冲区
然后应⽤程序可以调⽤read从接收缓冲区拿数据
另⼀⽅⾯，TCP的⼀个连接，既有发送缓冲区，也有接收缓冲区

对于这⼀个连接，既可以读数据，也可以写数据。这个概念叫做全双⼯

由于缓冲区的存在，TCP程序的读和写不需要⼀一匹配，例如:

读写100个字节的数据时：

1、可以一次读写一个字节，分 100 次读写

2、可以一次读写十个字节，分 10 次读写

3、可以一次读写50个字节，分 2 次读写

4、可以一次读写100个字节，一次读写完

……

这样读写虽然十分自由，但也会带来一些问题。相比于面向数据报的传输方式，通过面向字节流的方式每次传输的界限没有那么分明了。容易导致粘包问题：

即应用层数据包在TCP的接收缓冲区内连成一片，粘在一起

站在应⽤层的⻆度, 看到的只是⼀串连续的字节数据。当应用程序需要读取接收缓冲区内的数据时，由于TCP是面向字节流的，因此缓冲区内数据怎么读都有可能。

可能会读出 a，a，a，b，b，b，c，c，c

也可能读出 aaa，bbb，ccc

还可能读出 aaabbbccc

……

这样肯定是不利于正确读取数据包意义的。想要解决粘包问题，关键就是要明确“包之间的边界”

方案一：指定分隔符

比如我们可以约定，请求响应都以 “\n” 结尾。这样在发送读取的时候都用 “\n” 作为分隔符，每当读写到 “\n” 时，就意味着一个数据包已经结束了，应用端就可以正常对这个数据包进行解析了。

不过，采用这种方案时一定要注意避免数据内容的正文中也会出现分隔符。比如采用ASCII中靠前的目前已不再使用的一些“控制字符”作为分隔符就比较合适。

常见的几种协议有xml、yml、json等，一般适用于文本类的数据的传输。

方案二：指定数据的长度

比如，约定在每个应用层数据包的开头2~4个字节，表示数据包的长度

UDP协议采用的就是这种方案。因此UDP传输是不会出现粘包问题的

四、异常情况处理

现实的网络通信中，不是每一次通信都能够正常完成“四次挥手”断开连接的，可能会遇到各种各样的异常情况。

1、进程崩溃

进程崩溃，听起来很严重，实际上操作系统会做好善后。当进程崩溃时，进程中的PCB就会被回收了，PCB中的⽂件描述符中的所有文件都会被操作系统自动关闭，仍然可以发送FIN。和正常关闭没有什么区别

2、主机关机（正常关机）

正常点击关机键关机时，操作系统会先终止所有进程，同时也会触发“四次挥手”机制。而这时就可能会出现两种情况：

（1）四次挥手完成后，关机才真正完成

这种情况不会有什么问题，通信会正常断开

（2）四次挥手还没有挥完，就已经关机完毕了

这时就有可能收不到 B 发来的 FIN 请求，也就无法像其返回ack，而 B 并不知道 A 已经关机了，接收不到 ack 就会导致四次挥手迟迟不能完成，通信也就无法正常断开了。

由于 B 接收不到 A 的ACK应答报文，等待一定时间就会触发“超时重传”机制重新发送 FIN报文。当 B 重传一定次数还没有响应时，就会主动断开连接（把保存的 A 的信息删掉了）。虽然过程有些曲折，但最终也能成功让通信断开

3、主机断电（异常关机）

（1）接收方断电

这时 A 给 B 发送数据，就不会再返回 ACK 了。

A 就会触发超时重传，当多次重传都没有得到 ACK 时，A就会尝试重置连接（reset）。如果重置操作也没有 ACK，A 就会单方面的释放连接（把 B 的信息删掉）

（2）发送方断电

A 发着发着没声了。在 B 的视角看来，并不确定 A 是终止了，还是说就是这段时间没有请求而已。此时，B 就会给 A 发送一个数据包，询问 A 是否还在。

如果发了探测报文后，A 返回了 ACK，就说明 A 只是暂时没有请求而已。但如果连续发了多个探测报文，A 都没有返回 ACK，就可以认为 A 是异常终止了。就会单方面释放连接。

TCP内置了⼀个保活定时器，会定时发送这样的探测报文。因为这样的报文是用来探测对方“生死”的，因此也会被称之为“心跳包”

4、网线断开

与主机断电类似。只不过是通信双方都感知不到对方的存在了。

A 的视角：A 收不到 ACK ，触发多次超时重传，然后尝试重置连接，最后会单方面释放连接
B的视角：A 忽然没有反应了。发多次心跳包也没有回应，最后也会单方面释放连接

这样，虽然过程曲折，但最后的结果还是成功让双方断开连接了。这样的处理还是能够让人接受的

总结

那么本篇文章就到此为止了，如果觉得这篇文章对你有帮助的话，可以点一下关注和点赞来支持作者哦。如果有什么讲的不对的地方欢迎在评论区指出，希望能够和你们一起进步✊

原文地址：https://blog.csdn.net/acm_pn/article/details/142870908

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：垂直AI大模型行业全景分析及发展趋势研究报告
下一篇：数据库（1）

Windows Defender Credential Guard does not allow using saved credentials
【代码】Windows Defender Credential Guard does not allow using saved credentials。
阅读更多2024-10-13
MySQL的基础使用
alter table 表名 add [column] 新字段名字段类型 [字段属性] [位置 first/after 字段名];:create table 表名(字段名字段类型[字段属性],字段
阅读更多2024-10-13
FlexMatch: Boosting Semi-Supervised Learning with Curriculum Pseudo Labeling
最近提出的FixMatch在大多数半监督学习（SSL）基准上取得了最先进的结果。然而，像其他现代SSL算法一样，FixMatch为所有类别使用预定义的恒定阈值来选择有助于训练的未标记数据，忽略了不同类
阅读更多2024-10-13
linux_ssh免密登录
SSH（Secure Shell）协议是一种安全的网络协议，认证原理是基于用户名密码和基于密钥对两种认证方式，本次讲解基于密钥对的认证方式，也就是免密登录。
阅读更多2024-10-13
路径规划——RRT、RRT*、RRT-Connect算法说明
RRT是一种快速的路径规划方法，通过随机采样不断扩展树，适用于复杂环境中的初步路径搜索。RRT* 是 RRT 的优化版本，强调寻找最优路径，在每次扩展时对路径进行修正和优化。通过双树结构加速路径找到过
阅读更多2024-10-13
利用 Llama 3.1模型 + Dify开源LLM应用开发平台，在你的Windows环境中搭建一套AI工作流
利用 Llama 3.1模型 + Dify开源LLM应用开发平台，在你的Windows环境中搭建一套AI工作流
阅读更多2024-10-13
AutoML：自动化机器学习的技术与应用
AutoML（自动化机器学习）是近年来机器学习领域的一个热门研究方向，它的核心目标是通过自动化手段完成机器学习工作流中的各个环节，使得非专业人员也能轻松构建高效的模型。在传统机器学习流程中，模型的选择
阅读更多2024-10-13
鸿蒙面试的一些可能问到的点
Link 装饰的变量和父组件会构建双向同步关系，子组件使用 @Link 定义变量的时候不需要赋值, 而是调用子组件的时候进行赋值，调用子组件赋值的时候使用 "$变量名" 的形式进行
阅读更多2024-10-13
【ICPC】The 2024 ICPC Kunming Invitational Contest J
最短路 #图论 #数据结构 #二分。
阅读更多2024-10-13
详解安卓和IOS的唤起APP的机制，包括第三方平台的唤起方法比如微信
App Links是Google推出的类似于Universal Links的技术，它允许你在Android上使用标准的HTTP链接来打开特定的应用程序。Universal Links是苹果推出的一种更
阅读更多2024-10-13