自学内容网 自学内容网

【Linux网络编程】第十七弹---深入理解以太网与ARP协议:从帧格式到数据报解析

个人主页: 熬夜学编程的小林

💗系列专栏: 【C语言详解】 【数据结构详解】【C++详解】【Linux系统编程】【Linux网络编程】

目录

1、认识以太网

1.1、以太网帧格式

1.2、认识 MAC 地址

1.3、对比理解 MAC 地址和 IP 地址

1.4、认识 MTU

1.5、MTU 对 IP 协议的影响

1.6、MTU 对 UDP 协议的影响

1.7、MTU 对于 TCP 协议的影响

1.8、查看硬件地址和 MTU 

2、ARP 协议

2.1、ARP 协议的作用

2.2、ARP 协议的工作流程 

2.2.1、查询ARP缓存

2.2.2、发送ARP请求

2.2.3、接收并处理ARP请求

2.2.4、发送ARP响应

2.2.5、接收并处理ARP响应

2.2.6、数据传输

2.2.7、ARP缓存的更新和管理

2.3、ARP 数据报的格式 


数据链路层

用于两个设备(同一种数据链路节点)之间进行传递.

1、认识以太网

  • "以太网" 不是一种具体的网络, 而是一种技术标准; 既包含了数据链路层的内容, 也包含了一些物理层的内容. 例如: 规定了网络拓扑结构, 访问控制方式, 传输速率等;
  • 例如以太网中的网线必须使用双绞线; 传输速率有 10M, 100M, 1000M 等;
  • 以太网当前应用最广泛的局域网技术; 和以太网并列的还有令牌环网, 无线LAN 等;

1.1、以太网帧格式

以太网的帧格式如下所示: 

  • 源地址和目的地址是指网卡的硬件地址(也叫 MAC 地址), 长度是 48 位,是在网卡出厂时固化的;
  • 帧协议类型字段有三种值,分别对应 IP、ARP、RARP;
  • 帧末尾是 CRC 校验码

模拟局域网通信

 模拟局域网通信(有交换机)

 

1.2、认识 MAC 地址

  • MAC 地址用来识别数据链路层中相连的节点;
  • 长度为 48 位, 及 6 个字节. 一般用 16 进制数字加上冒号的形式来表示(例如:08:00:27:03:fb:19)
  • 在网卡出厂时就确定了, 不能修改. mac 地址通常是唯一的(虚拟机中的 mac 地址不是真实的 mac 地址, 可能会冲突; 也有些网卡支持用户配置 mac 地址). 

1.3、对比理解 MAC 地址和 IP 地址

  • IP 地址描述的是路途总体的 起点 和 终点;
  • MAC 地址描述的是路途上的每一个区间的起点和终点;

1.4、认识 MTU

  • MTU 相当于发快递时对包裹尺寸的限制. 这个限制是不同的数据链路对应的物理层, 产生的限制.
  • 以太网帧中的数据长度规定最小 46 字节,最大 1500 字节,ARP 数据包的长度不够 46 字节,要在后面补填充位;
  • 最大值 1500 称为以太网的最大传输单元(MTU),不同的网络类型有不同的MTU;
  • 如果一个数据包从以太网路由到拨号链路上,数据包长度大于拨号链路的 MTU了,则需要对数据包进行分片(fragmentation);
  • 不同的数据链路层标准的 MTU 是不同的; 

1.5、MTU 对 IP 协议的影响

由于数据链路层 MTU 的限制, 对于较大的 IP 数据包要进行分包. 

  • 将较大的 IP 包分成多个小包, 并给每个小包打上标签(分包和加标签);
  • 每个小包 IP 协议头的 16 位标识(id) 都是相同的(标签原则);
  • 每个小包的 IP 协议头的 3 位标志字段中, 第 2 位置为 0, 表示允许分片, 第 3 位来表示结束标记(当前是否是最后一个小包, 是的话置为 1, 否则置为 0)(标签原则);
  • 到达对端时再将这些小包, 会按顺序重组, 拼装到一起返回给传输层(合并小包);
  • 一旦这些小包中任意一个小包丢失, 接收端的重组就会失败. 但是 IP 层不会负责重新传输数据;(丢包情况)

1.6、MTU 对 UDP 协议的影响

让我们回顾一下 UDP 协议: 

  • 一旦 UDP 携带的数据超过 1472(1500 - 20(IP 首部) - 8(UDP 首部)), 那么就会在网络层分成多个 IP 数据报.
  • 这多个 IP 数据报有任意一个丢失, 都会引起接收端网络层重组失败. 那么这就意味着, 如果 UDP 数据报在网络层被分片, 整个数据被丢失的概率就大大增加了.

1.7、MTU 对于 TCP 协议的影响

让我们再回顾一下 TCP 协议: 

  • TCP 的一个数据报也不能无限大, 还是受制于 MTU. TCP 的单个数据报的最大消息长度, 称为 MSS(Max Segment Size);
  • TCP 在建立连接的过程中, 通信双方会进行 MSS 协商.
  • 最理想的情况下, MSS 的值正好是在 IP 不会被分片处理的最大长度(这个长度仍然是受制于数据链路层的 MTU).
  • 双方在发送 SYN 的时候会在 TCP 头部写入自己能支持的 MSS 值.
  • 然后双方得知对方的 MSS 值之后, 选择较小的作为最终 MSS.
  • MSS 的值就是在 TCP 首部的 40 字节变长选项中(kind=2);

MSS 和 MTU 的关系 

1.8、查看硬件地址和 MTU 

使用 ifconfig 命令, 即可查看 ip 地址, mac 地址, 和 MTU;

2、ARP 协议

虽然我们在这里介绍 ARP 协议, 但是需要强调, ARP 不是一个单纯的数据链路层的协议, 而是一个介于数据链路层和网络层之间的协议;

2.1、ARP 协议的作用

route命令 

ARP 协议建立了主机 IP 地址 和 MAC 地址 的映射关系. 

  • 在网络通讯时,源主机的应用程序知道目的主机的 IP 地址和端口号,却不知道目的主机的硬件地址;
  • 数据包首先是被网卡接收到再去处理上层协议的,如果接收到的数据包的硬件地址与本机不符,则直接丢弃;
  • 因此在通讯前必须获得目的主机的硬件地址;

2.2、ARP 协议的工作流程 

  • 源主机发出 ARP 请求,询问“IP 地址是 192.168.0.1 的主机的硬件地址是多少”, 并将这个请求广播到本地网段(以太网帧首部的硬件地址填 FF:FF:FF:FF:FF:FF 表示广播);
  • 目的主机接收到广播的 ARP 请求,发现其中的 IP 地址与本机相符,则发送一个ARP 应答数据包给源主机,将自己的硬件地址填写在应答包中;
  • 每台主机都维护一个 ARP 缓存表,可以用 arp -a 命令查看。缓存表中的表项有过期时间(一般为 20 分钟),如果 20 分钟内没有再次使用某个表项,则该表项失效,下次还要发 ARP 请求来获得目的主机的硬件地址

ARP协议具体工作流程:

ARP(地址解析协议)的工作流程是一个用于在同一局域网内根据IP地址解析出对应MAC地址的过程。

2.2.1、查询ARP缓存

当主机A需要向主机B发送数据时,它首先会在自己的ARP缓存中查找是否已经有主机B的IP地址与MAC地址的映射关系。

  • 如果在ARP缓存中找到了主机B的MAC地址,那么主机A会直接使用该MAC地址进行数据封装和发送,跳过后续的ARP请求和响应步骤。
  • 如果在ARP缓存中没有找到主机B的MAC地址,那么主机A会进行下一步的ARP请求。

2.2.2、发送ARP请求

主机A会构造一个ARP请求报文,该报文包含了以下内容:

  • 源主机的IP地址和MAC地址(即主机A的IP地址和MAC地址)。
  • 目标主机的IP地址(即主机B的IP地址),但目标主机的MAC地址字段通常填充为全0,表示未知。

然后,主机A会以广播的方式将ARP请求报文发送到本地网络上的所有主机。这个广播报文会被网络上的每一台主机接收到。

2.2.3、接收并处理ARP请求

网络上的每一台主机都会检查接收到的ARP请求报文中的目标IP地址是否与自己的IP地址匹配。

  • 如果不匹配,该主机将丢弃ARP请求报文,不做任何处理。
  • 如果匹配(即该主机是主机B),那么主机B会进行下一步的ARP响应。

在响应之前,主机B还会将ARP请求报文中的源主机的IP地址和MAC地址(即主机A的IP地址和MAC地址)添加到自己的ARP缓存中,以备将来使用。

2.2.4、发送ARP响应

主机B会构造一个ARP响应报文,该报文包含了以下内容:

  • 源主机的IP地址和MAC地址(即主机B的IP地址和MAC地址)。
  • 目标主机的IP地址和MAC地址(即主机A的IP地址和MAC地址,但这里的MAC地址是已知的,因为是从ARP请求报文中获取的)。

然后,主机B会以单播的方式将ARP响应报文发送回主机A。

2.2.5、接收并处理ARP响应

主机A接收到主机B发送的ARP响应报文后,会从中提取出主机B的MAC地址,并将其添加到自己的ARP缓存中,与主机B的IP地址形成映射关系。

至此,主机A已经成功获取到了主机B的MAC地址,可以开始进行数据的封装和发送了。

2.2.6、数据传输

一旦获得了目标MAC地址,主机A就可以将数据封装成帧,并将其发送到网络上。这个帧包含了源MAC地址(主机A的MAC地址)、目标MAC地址(主机B的MAC地址)以及要传输的数据。

2.2.7、ARP缓存的更新和管理

ARP缓存中的条目通常有一个生存时间(TTL),过期后会被自动删除。这样,当网络拓扑结构发生变化时(例如,主机B的MAC地址发生变化),ARP缓存中的旧条目会被自动清除,新的ARP请求和响应过程会重新进行,以确保数据的正确传输。

此外,ARP缓存还可以手动清除或刷新,以适应网络环境的变化

综上所述,ARP协议的工作流程是一个动态的过程,它通过ARP请求和响应来解析IP地址与MAC地址的映射关系,从而实现数据的正确传输

想一想,为什么要有缓存表?

  1. 提高读取性能:缓存表可以将频繁访问的数据存储在内存中,从而减少对磁盘或持久化存储的访问次数。由于内存的访问速度远快于磁盘,因此可以显著提高数据的读取性能。
  2. 减少网络延迟:在分布式系统中,缓存表可以减少对远程服务器的访问,从而降低网络延迟。
  3. 优化资源利用:通过将热点数据存储在缓存表中,可以更有效地利用系统资源,避免对不必要的数据进行重复处理。

为什么表项要有过期时间而不是一直有效?

  1. 数据有效性:数据在存储一段时间后可能会变得过时或无效。通过设置过期时间,可以确保系统只使用最新的有效数据。
  2. 资源回收:过期时间可以帮助系统回收不再使用的资源,从而避免资源浪费。当表项过期后,系统可以将其从缓存中删除,为新的数据腾出空间。
  3. 防止内存泄漏:在编程中,如果缓存表项没有设置过期时间,可能会导致内存泄漏问题。因为数据会一直占用内存空间,即使它们已经不再被使用。通过设置过期时间,可以确保系统定期清理不再使用的数据,从而避免内存泄漏。

再想一想, 结合我们刚才讲的工作流程, ARP 的数据报应该是一个什么样的格式? 

  1. 以太网帧头

    • 目的MAC地址:占6字节,表示目标主机的MAC地址。在ARP请求帧中,目标MAC地址通常设置为广播地址FF:FF:FF:FF:FF:FF,以便将请求发送到网络上的所有设备。
    • 源MAC地址:占6字节,表示源主机的MAC地址。
    • 帧类型:占2字节,表示后面报文类型。对于ARP报文来说,该字段值通常为0x0806。
  2. ARP报文头

    • 硬件类型:占2字节,表示硬件地址的类型。值为1时表示以太网地址。
    • 协议类型:占2字节,表示要映射的协议地址类型。值等于0x0800时为IPv4协议。
    • MAC地址长度:占1字节,表示MAC地址长度。对于以太网来说,该值为6。
    • IP地址长度:占1字节,表示IP地址长度。对于IPv4来说,该值为4。
    • 操作类型:占2字节,表示ARP报文类型。值等于1时为ARP请求报文,值等于2时为ARP应答报文。
    • 源MAC地址:占6字节(在ARP请求和应答报文中都存在),表示源主机的MAC地址。
    • 源IP地址:占4字节(在ARP请求和应答报文中都存在),表示源主机的IP地址。
    • 目的MAC地址:占6字节(在ARP应答报文中存在),表示目标主机的MAC地址。在ARP请求报文中,该字段值通常全为0。
    • 目的IP地址:占4字节(在ARP请求和应答报文中都存在),表示目标主机的IP地址。

2.3、ARP 数据报的格式 

  • 注意到源 MAC 地址、目的 MAC 地址在以太网首部和 ARP 请求中各出现一次,对于链路层为以太网的情况是多余的,但如果链路层是其它类型的网络则有可能是必要的。
  • 硬件类型链路层网络类型,1 为以太网;
  • 协议类型要转换的地址类型,0x0800 为 IP 地址;
  • 硬件地址长度对于以太网地址为 6 字节;
  • 协议地址长度对于 IP 地址为 4 字节;
  • op 字段1 表示 ARP 请求,op 字段2 表示 ARP 应答。 

原文地址:https://blog.csdn.net/2201_75584283/article/details/143490424

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!