【Linux网络编程】第十七弹---深入理解以太网与ARP协议:从帧格式到数据报解析
✨个人主页: 熬夜学编程的小林
💗系列专栏: 【C语言详解】 【数据结构详解】【C++详解】【Linux系统编程】【Linux网络编程】
目录
数据链路层
用于两个设备(同一种数据链路节点)之间进行传递.
1、认识以太网
- "以太网" 不是一种具体的网络, 而是一种技术标准; 既包含了数据链路层的内容, 也包含了一些物理层的内容. 例如: 规定了网络拓扑结构, 访问控制方式, 传输速率等;
- 例如以太网中的网线必须使用双绞线; 传输速率有 10M, 100M, 1000M 等;
- 以太网是当前应用最广泛的局域网技术; 和以太网并列的还有令牌环网, 无线LAN 等;
1.1、以太网帧格式
以太网的帧格式如下所示:
- 源地址和目的地址是指网卡的硬件地址(也叫 MAC 地址), 长度是 48 位,是在网卡出厂时固化的;
- 帧协议类型字段有三种值,分别对应 IP、ARP、RARP;
- 帧末尾是 CRC 校验码。
模拟局域网通信
模拟局域网通信(有交换机)
1.2、认识 MAC 地址
- MAC 地址用来识别数据链路层中相连的节点;
- 长度为 48 位, 及 6 个字节. 一般用 16 进制数字加上冒号的形式来表示(例如:08:00:27:03:fb:19)
- 在网卡出厂时就确定了, 不能修改. mac 地址通常是唯一的(虚拟机中的 mac 地址不是真实的 mac 地址, 可能会冲突; 也有些网卡支持用户配置 mac 地址).
1.3、对比理解 MAC 地址和 IP 地址
- IP 地址描述的是路途总体的 起点 和 终点;
- MAC 地址描述的是路途上的每一个区间的起点和终点;
1.4、认识 MTU
- MTU 相当于发快递时对包裹尺寸的限制. 这个限制是不同的数据链路对应的物理层, 产生的限制.
- 以太网帧中的数据长度规定最小 46 字节,最大 1500 字节,ARP 数据包的长度不够 46 字节,要在后面补填充位;
- 最大值 1500 称为以太网的最大传输单元(MTU),不同的网络类型有不同的MTU;
- 如果一个数据包从以太网路由到拨号链路上,数据包长度大于拨号链路的 MTU了,则需要对数据包进行分片(fragmentation);
- 不同的数据链路层标准的 MTU 是不同的;
1.5、MTU 对 IP 协议的影响
由于数据链路层 MTU 的限制, 对于较大的 IP 数据包要进行分包.
- 将较大的 IP 包分成多个小包, 并给每个小包打上标签(分包和加标签);
- 每个小包 IP 协议头的 16 位标识(id) 都是相同的(标签原则);
- 每个小包的 IP 协议头的 3 位标志字段中, 第 2 位置为 0, 表示允许分片, 第 3 位来表示结束标记(当前是否是最后一个小包, 是的话置为 1, 否则置为 0)(标签原则);
- 到达对端时再将这些小包, 会按顺序重组, 拼装到一起返回给传输层(合并小包);
- 一旦这些小包中任意一个小包丢失, 接收端的重组就会失败. 但是 IP 层不会负责重新传输数据;(丢包情况)
1.6、MTU 对 UDP 协议的影响
让我们回顾一下 UDP 协议:
- 一旦 UDP 携带的数据超过 1472(1500 - 20(IP 首部) - 8(UDP 首部)), 那么就会在网络层分成多个 IP 数据报.
- 这多个 IP 数据报有任意一个丢失, 都会引起接收端网络层重组失败. 那么这就意味着, 如果 UDP 数据报在网络层被分片, 整个数据被丢失的概率就大大增加了.
1.7、MTU 对于 TCP 协议的影响
让我们再回顾一下 TCP 协议:
- TCP 的一个数据报也不能无限大, 还是受制于 MTU. TCP 的单个数据报的最大消息长度, 称为 MSS(Max Segment Size);
- TCP 在建立连接的过程中, 通信双方会进行 MSS 协商.
- 最理想的情况下, MSS 的值正好是在 IP 不会被分片处理的最大长度(这个长度仍然是受制于数据链路层的 MTU).
- 双方在发送 SYN 的时候会在 TCP 头部写入自己能支持的 MSS 值.
- 然后双方得知对方的 MSS 值之后, 选择较小的作为最终 MSS.
- MSS 的值就是在 TCP 首部的 40 字节变长选项中(kind=2);
MSS 和 MTU 的关系
1.8、查看硬件地址和 MTU
使用 ifconfig 命令, 即可查看 ip 地址, mac 地址, 和 MTU;
2、ARP 协议
虽然我们在这里介绍 ARP 协议, 但是需要强调, ARP 不是一个单纯的数据链路层的协议, 而是一个介于数据链路层和网络层之间的协议;
2.1、ARP 协议的作用
route命令
ARP 协议建立了主机 IP 地址 和 MAC 地址 的映射关系.
- 在网络通讯时,源主机的应用程序知道目的主机的 IP 地址和端口号,却不知道目的主机的硬件地址;
- 数据包首先是被网卡接收到再去处理上层协议的,如果接收到的数据包的硬件地址与本机不符,则直接丢弃;
- 因此在通讯前必须获得目的主机的硬件地址;
2.2、ARP 协议的工作流程
- 源主机发出 ARP 请求,询问“IP 地址是 192.168.0.1 的主机的硬件地址是多少”, 并将这个请求广播到本地网段(以太网帧首部的硬件地址填 FF:FF:FF:FF:FF:FF 表示广播);
- 目的主机接收到广播的 ARP 请求,发现其中的 IP 地址与本机相符,则发送一个ARP 应答数据包给源主机,将自己的硬件地址填写在应答包中;
- 每台主机都维护一个 ARP 缓存表,可以用 arp -a 命令查看。缓存表中的表项有过期时间(一般为 20 分钟),如果 20 分钟内没有再次使用某个表项,则该表项失效,下次还要发 ARP 请求来获得目的主机的硬件地址
ARP协议具体工作流程:
ARP(地址解析协议)的工作流程是一个用于在同一局域网内根据IP地址解析出对应MAC地址的过程。
2.2.1、查询ARP缓存
当主机A需要向主机B发送数据时,它首先会在自己的ARP缓存中查找是否已经有主机B的IP地址与MAC地址的映射关系。
- 如果在ARP缓存中找到了主机B的MAC地址,那么主机A会直接使用该MAC地址进行数据封装和发送,跳过后续的ARP请求和响应步骤。
- 如果在ARP缓存中没有找到主机B的MAC地址,那么主机A会进行下一步的ARP请求。
2.2.2、发送ARP请求
主机A会构造一个ARP请求报文,该报文包含了以下内容:
- 源主机的IP地址和MAC地址(即主机A的IP地址和MAC地址)。
- 目标主机的IP地址(即主机B的IP地址),但目标主机的MAC地址字段通常填充为全0,表示未知。
然后,主机A会以广播的方式将ARP请求报文发送到本地网络上的所有主机。这个广播报文会被网络上的每一台主机接收到。
2.2.3、接收并处理ARP请求
网络上的每一台主机都会检查接收到的ARP请求报文中的目标IP地址是否与自己的IP地址匹配。
- 如果不匹配,该主机将丢弃ARP请求报文,不做任何处理。
- 如果匹配(即该主机是主机B),那么主机B会进行下一步的ARP响应。
在响应之前,主机B还会将ARP请求报文中的源主机的IP地址和MAC地址(即主机A的IP地址和MAC地址)添加到自己的ARP缓存中,以备将来使用。
2.2.4、发送ARP响应
主机B会构造一个ARP响应报文,该报文包含了以下内容:
- 源主机的IP地址和MAC地址(即主机B的IP地址和MAC地址)。
- 目标主机的IP地址和MAC地址(即主机A的IP地址和MAC地址,但这里的MAC地址是已知的,因为是从ARP请求报文中获取的)。
然后,主机B会以单播的方式将ARP响应报文发送回主机A。
2.2.5、接收并处理ARP响应
主机A接收到主机B发送的ARP响应报文后,会从中提取出主机B的MAC地址,并将其添加到自己的ARP缓存中,与主机B的IP地址形成映射关系。
至此,主机A已经成功获取到了主机B的MAC地址,可以开始进行数据的封装和发送了。
2.2.6、数据传输
一旦获得了目标MAC地址,主机A就可以将数据封装成帧,并将其发送到网络上。这个帧包含了源MAC地址(主机A的MAC地址)、目标MAC地址(主机B的MAC地址)以及要传输的数据。
2.2.7、ARP缓存的更新和管理
ARP缓存中的条目通常有一个生存时间(TTL),过期后会被自动删除。这样,当网络拓扑结构发生变化时(例如,主机B的MAC地址发生变化),ARP缓存中的旧条目会被自动清除,新的ARP请求和响应过程会重新进行,以确保数据的正确传输。
此外,ARP缓存还可以手动清除或刷新,以适应网络环境的变化。
综上所述,ARP协议的工作流程是一个动态的过程,它通过ARP请求和响应来解析IP地址与MAC地址的映射关系,从而实现数据的正确传输。
想一想,为什么要有缓存表?
- 提高读取性能:缓存表可以将频繁访问的数据存储在内存中,从而减少对磁盘或持久化存储的访问次数。由于内存的访问速度远快于磁盘,因此可以显著提高数据的读取性能。
- 减少网络延迟:在分布式系统中,缓存表可以减少对远程服务器的访问,从而降低网络延迟。
- 优化资源利用:通过将热点数据存储在缓存表中,可以更有效地利用系统资源,避免对不必要的数据进行重复处理。
为什么表项要有过期时间而不是一直有效?
- 数据有效性:数据在存储一段时间后可能会变得过时或无效。通过设置过期时间,可以确保系统只使用最新的有效数据。
- 资源回收:过期时间可以帮助系统回收不再使用的资源,从而避免资源浪费。当表项过期后,系统可以将其从缓存中删除,为新的数据腾出空间。
- 防止内存泄漏:在编程中,如果缓存表项没有设置过期时间,可能会导致内存泄漏问题。因为数据会一直占用内存空间,即使它们已经不再被使用。通过设置过期时间,可以确保系统定期清理不再使用的数据,从而避免内存泄漏。
再想一想, 结合我们刚才讲的工作流程, ARP 的数据报应该是一个什么样的格式?
以太网帧头:
- 目的MAC地址:占6字节,表示目标主机的MAC地址。在ARP请求帧中,目标MAC地址通常设置为广播地址FF:FF:FF:FF:FF:FF,以便将请求发送到网络上的所有设备。
- 源MAC地址:占6字节,表示源主机的MAC地址。
- 帧类型:占2字节,表示后面报文类型。对于ARP报文来说,该字段值通常为0x0806。
ARP报文头:
- 硬件类型:占2字节,表示硬件地址的类型。值为1时表示以太网地址。
- 协议类型:占2字节,表示要映射的协议地址类型。值等于0x0800时为IPv4协议。
- MAC地址长度:占1字节,表示MAC地址长度。对于以太网来说,该值为6。
- IP地址长度:占1字节,表示IP地址长度。对于IPv4来说,该值为4。
- 操作类型:占2字节,表示ARP报文类型。值等于1时为ARP请求报文,值等于2时为ARP应答报文。
- 源MAC地址:占6字节(在ARP请求和应答报文中都存在),表示源主机的MAC地址。
- 源IP地址:占4字节(在ARP请求和应答报文中都存在),表示源主机的IP地址。
- 目的MAC地址:占6字节(在ARP应答报文中存在),表示目标主机的MAC地址。在ARP请求报文中,该字段值通常全为0。
- 目的IP地址:占4字节(在ARP请求和应答报文中都存在),表示目标主机的IP地址。
2.3、ARP 数据报的格式
- 注意到源 MAC 地址、目的 MAC 地址在以太网首部和 ARP 请求中各出现一次,对于链路层为以太网的情况是多余的,但如果链路层是其它类型的网络则有可能是必要的。
- 硬件类型指链路层网络类型,1 为以太网;
- 协议类型指要转换的地址类型,0x0800 为 IP 地址;
- 硬件地址长度对于以太网地址为 6 字节;
- 协议地址长度对于 IP 地址为 4 字节;
- op 字段为 1 表示 ARP 请求,op 字段为 2 表示 ARP 应答。
原文地址:https://blog.csdn.net/2201_75584283/article/details/143490424
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!