【Linux网络编程】第十七弹---深入理解以太网与ARP协议：从帧格式到数据报解析

"以太网" 不是一种具体的网络, 而是一种技术标准; 既包含了数据链路层的内容, 也包含了一些物理层的内容. 例如: 规定了网络拓扑结构, 访问控制方式, 传输速率等;
例如以太网中的网线必须使用双绞线; 传输速率有 10M, 100M, 1000M 等;
以太网是当前应用最广泛的局域网技术; 和以太网并列的还有令牌环网, 无线LAN 等;

1.1、以太网帧格式

以太网的帧格式如下所示：

源地址和目的地址是指网卡的硬件地址(也叫 MAC 地址), 长度是 48 位,是在网卡出厂时固化的;
帧协议类型字段有三种值,分别对应 IP、ARP、RARP;
帧末尾是 CRC 校验码。

模拟局域网通信

模拟局域网通信(有交换机)

1.2、认识 MAC 地址

MAC 地址用来识别数据链路层中相连的节点;
长度为 48 位, 及 6 个字节. 一般用 16 进制数字加上冒号的形式来表示(例如:08:00:27:03:fb:19)
在网卡出厂时就确定了, 不能修改. mac 地址通常是唯一的(虚拟机中的 mac 地址不是真实的 mac 地址, 可能会冲突; 也有些网卡支持用户配置 mac 地址).

1.3、对比理解 MAC 地址和 IP 地址

IP 地址描述的是路途总体的起点和终点;
MAC 地址描述的是路途上的每一个区间的起点和终点;

1.4、认识 MTU

MTU 相当于发快递时对包裹尺寸的限制. 这个限制是不同的数据链路对应的物理层, 产生的限制.
以太网帧中的数据长度规定最小 46 字节,最大 1500 字节,ARP 数据包的长度不够 46 字节,要在后面补填充位;
最大值 1500 称为以太网的最大传输单元(MTU),不同的网络类型有不同的MTU;
如果一个数据包从以太网路由到拨号链路上,数据包长度大于拨号链路的 MTU了,则需要对数据包进行分片(fragmentation);
不同的数据链路层标准的 MTU 是不同的;

1.5、MTU 对 IP 协议的影响

由于数据链路层 MTU 的限制, 对于较大的 IP 数据包要进行分包.

将较大的 IP 包分成多个小包, 并给每个小包打上标签(分包和加标签);
每个小包 IP 协议头的 16 位标识(id) 都是相同的(标签原则);
每个小包的 IP 协议头的 3 位标志字段中, 第 2 位置为 0, 表示允许分片, 第 3 位来表示结束标记(当前是否是最后一个小包, 是的话置为 1, 否则置为 0)(标签原则);
到达对端时再将这些小包, 会按顺序重组, 拼装到一起返回给传输层(合并小包);
一旦这些小包中任意一个小包丢失, 接收端的重组就会失败. 但是 IP 层不会负责重新传输数据;(丢包情况)

1.6、MTU 对 UDP 协议的影响

让我们回顾一下 UDP 协议:

一旦 UDP 携带的数据超过 1472(1500 - 20(IP 首部) - 8(UDP 首部)), 那么就会在网络层分成多个 IP 数据报.
这多个 IP 数据报有任意一个丢失, 都会引起接收端网络层重组失败. 那么这就意味着, 如果 UDP 数据报在网络层被分片, 整个数据被丢失的概率就大大增加了.

1.7、MTU 对于 TCP 协议的影响

让我们再回顾一下 TCP 协议:

TCP 的一个数据报也不能无限大, 还是受制于 MTU. TCP 的单个数据报的最大消息长度, 称为 MSS(Max Segment Size);
TCP 在建立连接的过程中, 通信双方会进行 MSS 协商.
最理想的情况下, MSS 的值正好是在 IP 不会被分片处理的最大长度(这个长度仍然是受制于数据链路层的 MTU).
双方在发送 SYN 的时候会在 TCP 头部写入自己能支持的 MSS 值.
然后双方得知对方的 MSS 值之后, 选择较小的作为最终 MSS.
MSS 的值就是在 TCP 首部的 40 字节变长选项中(kind=2);

MSS 和 MTU 的关系

1.8、查看硬件地址和 MTU

使用 ifconfig 命令, 即可查看 ip 地址, mac 地址, 和 MTU;

2、ARP 协议

虽然我们在这里介绍 ARP 协议, 但是需要强调, ARP 不是一个单纯的数据链路层的协议, 而是一个介于数据链路层和网络层之间的协议;

2.1、ARP 协议的作用

route命令

ARP 协议建立了主机 IP 地址和 MAC 地址的映射关系.

在网络通讯时,源主机的应用程序知道目的主机的 IP 地址和端口号,却不知道目的主机的硬件地址;
数据包首先是被网卡接收到再去处理上层协议的,如果接收到的数据包的硬件地址与本机不符,则直接丢弃;
因此在通讯前必须获得目的主机的硬件地址;

2.2、ARP 协议的工作流程

源主机发出 ARP 请求,询问“IP 地址是 192.168.0.1 的主机的硬件地址是多少”, 并将这个请求广播到本地网段(以太网帧首部的硬件地址填 FF:FF:FF:FF:FF:FF 表示广播);
目的主机接收到广播的 ARP 请求,发现其中的 IP 地址与本机相符,则发送一个ARP 应答数据包给源主机,将自己的硬件地址填写在应答包中;
每台主机都维护一个 ARP 缓存表,可以用 arp -a 命令查看。缓存表中的表项有过期时间(一般为 20 分钟),如果 20 分钟内没有再次使用某个表项,则该表项失效,下次还要发 ARP 请求来获得目的主机的硬件地址

ARP协议具体工作流程：

ARP（地址解析协议）的工作流程是一个用于在同一局域网内根据IP地址解析出对应MAC地址的过程。

2.2.1、查询ARP缓存

当主机A需要向主机B发送数据时，它首先会在自己的ARP缓存中查找是否已经有主机B的IP地址与MAC地址的映射关系。

如果在ARP缓存中找到了主机B的MAC地址，那么主机A会直接使用该MAC地址进行数据封装和发送，跳过后续的ARP请求和响应步骤。
如果在ARP缓存中没有找到主机B的MAC地址，那么主机A会进行下一步的ARP请求。

2.2.2、发送ARP请求

主机A会构造一个ARP请求报文，该报文包含了以下内容：

源主机的IP地址和MAC地址（即主机A的IP地址和MAC地址）。
目标主机的IP地址（即主机B的IP地址），但目标主机的MAC地址字段通常填充为全0，表示未知。

然后，主机A会以广播的方式将ARP请求报文发送到本地网络上的所有主机。这个广播报文会被网络上的每一台主机接收到。

2.2.3、接收并处理ARP请求

网络上的每一台主机都会检查接收到的ARP请求报文中的目标IP地址是否与自己的IP地址匹配。

如果不匹配，该主机将丢弃ARP请求报文，不做任何处理。
如果匹配（即该主机是主机B），那么主机B会进行下一步的ARP响应。

在响应之前，主机B还会将ARP请求报文中的源主机的IP地址和MAC地址（即主机A的IP地址和MAC地址）添加到自己的ARP缓存中，以备将来使用。

2.2.4、发送ARP响应

主机B会构造一个ARP响应报文，该报文包含了以下内容：

源主机的IP地址和MAC地址（即主机B的IP地址和MAC地址）。
目标主机的IP地址和MAC地址（即主机A的IP地址和MAC地址，但这里的MAC地址是已知的，因为是从ARP请求报文中获取的）。

然后，主机B会以单播的方式将ARP响应报文发送回主机A。

2.2.5、接收并处理ARP响应

主机A接收到主机B发送的ARP响应报文后，会从中提取出主机B的MAC地址，并将其添加到自己的ARP缓存中，与主机B的IP地址形成映射关系。

至此，主机A已经成功获取到了主机B的MAC地址，可以开始进行数据的封装和发送了。

2.2.6、数据传输

一旦获得了目标MAC地址，主机A就可以将数据封装成帧，并将其发送到网络上。这个帧包含了源MAC地址（主机A的MAC地址）、目标MAC地址（主机B的MAC地址）以及要传输的数据。

2.2.7、ARP缓存的更新和管理

ARP缓存中的条目通常有一个生存时间（TTL），过期后会被自动删除。这样，当网络拓扑结构发生变化时（例如，主机B的MAC地址发生变化），ARP缓存中的旧条目会被自动清除，新的ARP请求和响应过程会重新进行，以确保数据的正确传输。

此外，ARP缓存还可以手动清除或刷新，以适应网络环境的变化。

综上所述，ARP协议的工作流程是一个动态的过程，它通过ARP请求和响应来解析IP地址与MAC地址的映射关系，从而实现数据的正确传输。

想一想,为什么要有缓存表?

提高读取性能：缓存表可以将频繁访问的数据存储在内存中，从而减少对磁盘或持久化存储的访问次数。由于内存的访问速度远快于磁盘，因此可以显著提高数据的读取性能。
减少网络延迟：在分布式系统中，缓存表可以减少对远程服务器的访问，从而降低网络延迟。
优化资源利用：通过将热点数据存储在缓存表中，可以更有效地利用系统资源，避免对不必要的数据进行重复处理。

为什么表项要有过期时间而不是一直有效?

数据有效性：数据在存储一段时间后可能会变得过时或无效。通过设置过期时间，可以确保系统只使用最新的有效数据。
资源回收：过期时间可以帮助系统回收不再使用的资源，从而避免资源浪费。当表项过期后，系统可以将其从缓存中删除，为新的数据腾出空间。
防止内存泄漏：在编程中，如果缓存表项没有设置过期时间，可能会导致内存泄漏问题。因为数据会一直占用内存空间，即使它们已经不再被使用。通过设置过期时间，可以确保系统定期清理不再使用的数据，从而避免内存泄漏。

再想一想, 结合我们刚才讲的工作流程, ARP 的数据报应该是一个什么样的格式?

以太网帧头：

目的MAC地址：占6字节，表示目标主机的MAC地址。在ARP请求帧中，目标MAC地址通常设置为广播地址FF:FF:FF:FF:FF:FF，以便将请求发送到网络上的所有设备。
源MAC地址：占6字节，表示源主机的MAC地址。
帧类型：占2字节，表示后面报文类型。对于ARP报文来说，该字段值通常为0x0806。

ARP报文头：

硬件类型：占2字节，表示硬件地址的类型。值为1时表示以太网地址。
协议类型：占2字节，表示要映射的协议地址类型。值等于0x0800时为IPv4协议。
MAC地址长度：占1字节，表示MAC地址长度。对于以太网来说，该值为6。
IP地址长度：占1字节，表示IP地址长度。对于IPv4来说，该值为4。
操作类型：占2字节，表示ARP报文类型。值等于1时为ARP请求报文，值等于2时为ARP应答报文。
源MAC地址：占6字节（在ARP请求和应答报文中都存在），表示源主机的MAC地址。
源IP地址：占4字节（在ARP请求和应答报文中都存在），表示源主机的IP地址。
目的MAC地址：占6字节（在ARP应答报文中存在），表示目标主机的MAC地址。在ARP请求报文中，该字段值通常全为0。
目的IP地址：占4字节（在ARP请求和应答报文中都存在），表示目标主机的IP地址。

2.3、ARP 数据报的格式

注意到源 MAC 地址、目的 MAC 地址在以太网首部和 ARP 请求中各出现一次,对于链路层为以太网的情况是多余的,但如果链路层是其它类型的网络则有可能是必要的。
硬件类型指链路层网络类型,1 为以太网;
协议类型指要转换的地址类型,0x0800 为 IP 地址;
硬件地址长度对于以太网地址为 6 字节;
协议地址长度对于 IP 地址为 4 字节;
op 字段为 1 表示 ARP 请求,op 字段为 2 表示 ARP 应答。

原文地址：https://blog.csdn.net/2201_75584283/article/details/143490424

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：重生之我在异世界学编程之数据结构与算法：深入队列篇
下一篇：【uni-app】微信小程序使用lime-painter生成海报

迅为瑞芯微RK3562开发板/核心板应用于人脸跟踪、身体跟踪、视频监控、自动语音识别(ASR)、图像分类驾驶员辅助系统(ADAS)、车牌识别、物体识别等
iTOP-3562开发板/核心板采用瑞芯微RK3562处理器，内部集成了四核A53+Mali G52架构，主频2GHZ，内置1TOPSNPU算力，RK809动态调频。支持几乎全格式的H.264解码，支
阅读更多2024-12-31
低精度只适用于未充分训练的LLM？腾讯提出LLM量化的scaling laws
尽管有一些研究声称原生的低比特LLM可以媲美fp16/bf16精度下的表现，但这些研究普遍都是在未充分语言模型上得到的结果从而推出的结论，研究人员认为在充分训练的情况下进行比较的话，低比特LLM也将很
阅读更多2024-12-31
医疗数仓配置Flume
Flume需要将Kafka中各topic的数据传输到HDFS，因此选用KafkaSource以及HDFSSink。对于安全性要求高的数据（不允许丢失）选用FileChannel，允许部分丢失的数据如日
阅读更多2024-12-31
Go中CAS算法
CAS算法常被用作乐观锁的实现方式，用于解决并发问题。例如，在计数器、缓存等场景中，可以使用CAS算法来确保数据的一致性和正确性。CAS操作会检查内存位置V的当前值是否与预期的旧值A相等。这一操作是原
阅读更多2024-12-31
Node.js 记账本项目总结
在使用Node.js结合Express框架构建记账本的过程中，遇到了一些常见的问题，这些问题主要集中在路径处理、包管理工具的选择、开发环境优化以及HTTP响应处理等方面。
阅读更多2024-12-31
Java 处理base64文件上传
在系统内有一个类似于公告的模块，如果里面添加的文章不是选择富文本上传图片的方式，而是选择复制别的文章直接粘贴到系统内的富文本，里面的图片就不会url，而是图片的base64格式，这样会导致数据库存储压
阅读更多2024-12-31
Tailwind CSS 实战：现代登录注册页面开发
基础结构搭建表单组件开发社交登录集成响应式适配深色模式支持动画效果表单验证性能优化可访问性增强通过合理使用 Tailwind CSS 的原子类，我们不仅实现了美观的界面，还确保了良好的用户体验和可维护
阅读更多2024-12-31
node.js下载、安装、设置国内镜像源（永久）（Windows11）
系统：Windows 11。
阅读更多2024-12-31
Slate文档编辑器-Decorator装饰器渲染调度
在这里我们主要讨论了slate中的decoration装饰器的实现，以及在实际使用中可能会遇到的问题，主要是在跨节点的情况下，我们需要将range拆分为多个range，然后分别进行处理，并且还分析了源
阅读更多2024-12-31
python去水印
请注意，这种方法仅适用于简单的水印去除，对于复杂的水印或嵌入到图像纹理中的水印，可能无法达到理想的效果。在实际应用中，还可以考虑使用深度学习的方法，如生成对抗网络（GAN）来去除水印，但需要大量的数据
阅读更多2024-12-31