作者:sense宏江 | 来源:互联网 | 2023-09-24 11:19
前言
本章节概述数据链路层和ARP协议。实际上ARP协议被用在IP协议里,但是ARP确实是对IP与MAC地址的转换,更贴近数据链路层的协议。无论将ARP归属于哪层协议都可以。
数据链路层
数据链路层主要是规定数据传输的方式,并非指双绞线等传输媒介。一般来说,数据在信道中传输有两种方式:
- 点对点信道:一对一通信
- 广播信道:一对多通信
我们本章是基于数据链路层的,因此暂时不关心物理层和网络层数据的流向。
点对点数据链路
数据链路和帧
链路≠数据链路
- 链路:从一个节点到相邻接点的一段物理线路,中间没有其他节点。
- 数据链路:链路+数据传输协议。
所以我们的数据链路层,说的就是相邻接点间的可靠传输。
点对点数据链路层在进行通信时主要步骤如下:
- 节点A的数据链路层把网络层交下来的IP数据报添加首部和尾部封装成帧。
- 节点A将帧发送给节点B,通过数据链路层
- 节点B判断收到的帧是否有差错,若有差错则丢弃,无差错则向上层交付。
所以,一切的一切都是三点:
- 封装成帧
- 透明传输
- 差错校验
封装成帧
在一段数据前后分别添加首部和尾部,便构成了一个帧。接收方收到帧后,通过首部和尾部信息,就可以知道一个帧的开始与结束。
SOH十六进制编码是01,二进制是00000001
EOT十六进制编码是04,二进制是00000100
只有一个帧同时存在SOH和EOT,才认为指可用的。
透明传输
我们之前说,EOT是结束符,但是如果帧中间意外的出现了一个帧结束符,那么后续部分就会被丢弃,这样帧数据便不是我们需要的帧。那我们怎么解决这个问题,就是透明传输要解决。
具体的方法是:发送端的数据链路层在数据中出现控制字符SOH或者EOT的前面加一个转义字符“ESC”,其十六进制编码是1B,二进制为00011011。接收端的数据链路层在网上传递信息时丢弃该字符。如果接收端收到两个转义字符,则丢弃前面的一个。
这种方法被称为字节填充。
差错校验
本章节说的差错都是比特差错。所谓比特差错,就是0变成了1,1变成了0。传输错误的比特占总传输比特的比率叫做误码率。
实际上的信道不是理想的,会出现噪音来导致比特差错。为了缓解比特差错,链路层使用CRC校验(循环冗余校验)。其基本原理如下:
发送端:
- 将数据划分为组,假设每组k kk比特。假设发送的数据M = 101001 M=101001M=101001(即k=6)。
- 在源数据后面加n位冗余码,构成一个帧发送过去,一共发送n+k位。
- n位冗余码:二进制模2运算,得到2 n ∗ M 2^n*M2n∗M,其实就是在M后加n个0。
- 得到的(k+n)位数除以收发双方实现商定的长度为(n+1)位的除数P。
- 假设得到的商是Q,余数是R。R即为冗余码附在源数据之后。
二进制除法不作详解。
接收方:
- 得到的帧进行对P的模2运算。
- 若余数为0,则认为无差错,否则丢弃帧
点对点协议PPP
- 最头与最尾都是标志字段F(Flag),规定为0x7E。这是帧定界符,连续两个帧之间应该只存在一个F,若出现两个连续的F,则丢弃。
- A为0xFF,C为0x03,至今未定义,只是保留。
- 协议部分,当协议为0x0021,指的是IP数据报,0xC021是LCP控制协议数据,0x8021是网络层控制数据。
字节填充与零比特填充
当数据部分含有0x7E这个数据段时,会被误认为是帧结束符。因此我们需要避免这种情况:
- 信息字段中出现的每一个0x7E变成两个字节:(0x7D,0x5E)
- 若信息中出现一个0x7D,则将其转变成(0x7D,0x5D)
- 若信息中出现ASCII码控制符,即数值小于0x20的字符,在该字符前加一个0x7D,并将其转换成2字节序列。比如0x03变成0x23
当PPP协议采用同步传输(上面是异步传输),同步传输发来的就是一串比特序列,就会用零比特传输防止出现连续6个1。具体做法是,在出现连续6个1时,在第五个1后添加一个0。
广播信道的数据链路层
我们把广播信道分为局域网和以太网,重点是局域网的广播信道,就是一对多的通信。
局域网
什么是局域网,简单说来,就是一个地理范围,站点数目受限的单位网络。通常说来,局域网比广域网有更低的延迟和较小的误码率。局域网的有点如下:
- 可以广播。局域网上的主机可以共享连接在局域网上的所有资源。
- 便于扩展以及调整灵活。
- 提升了系统的可靠性、可用性和安全性。
这里不对局域网类型(星型网、环形网、总线网等)做详述。
现在有一个问题,那就是局域网内终端可能会发生冲突,这怎么办?在广域网上,有信道复用技术,但是这不适用于局域网,因为代价比较高,我们在局域网中选择了另一种技术:动态媒体接入控制,又称为多点接入,它并非在用户通信时固定分配给用户的。它有两种分类:
- 随机接入型:任何主机在任何时间都可以发送数据,但是会出现数据碰撞,我们要想数据到达,就要配合解决碰撞的协议,一会我们会说。
- 受控接入型:主机需要收到一定的控制,典型代表有:分散控制的令牌环局域网和多点线路的轮询。
这里多提一句,我们现在在做商业开发的时候,会对节点做负载均衡,实际上令牌和轮询都是负载均衡的方法之一。其实计算机这个东西,看起来比较新的东西都是老概念的新运用,程序员文化水平不高,总是弄些新名词唬人,其实深入了解下去,大部分在计算机其他方向中早有运用。
受控接入在实际应用中比较少,所以这里只描述随机接入型。
适配器
一个计算机想要和局域网传输数据,那么就要用到网络适配器(network adapter)。最原始的电脑都是在主板上插入网络接口卡(NIC, Network Interface Card),现在都是嵌入的了,所以都叫适配器更贴切。
目前芯片集成度非常高,一个适配器会和CPU进行数据交互,还要和内存进行交互,因此也就不可避免的包括下一层——物理层的属性。所以我们没必要严格对适配器进行分类。了解这个之后,也就大概了解了一个很重要的知识点,在我前面的文章有:linux系统的零拷贝技术,具体是在讲Kafka为什么快那一节。
CSMA/CD协议
我们之前说了,随机接入不可避免的会有数据碰撞,如何避免碰撞或者如何在碰撞之后依旧可以传达数据,就要靠这个协议。互联网的设计是最简化的,意思是互联网不考虑数据传输的稳定性,也就是UDP的不可靠交付。所以底层并不会对数据进行校验与排序,这些都是高层协议处理的问题。但是在数据链路层,我们也需要一个协议保证数据可以“尽最大可能交付”,即使不用完美交付,也需要至少能做到尽力。于是CSMA/CD技术出来了,又叫载波监听多点接入/碰撞检测。
现在假设我们都是绅士,我们在聊天的时候,不会打断别人,我们希望自己的意见呗别人听取,我们又希望听到别人在说什么,怎么办?很简单,你说的时候我听,我说的时候你听,咱俩一起说的时候就都停止说,等到对方说完你再说。这就是CSMA/CD协议。
要点:
- 多点接入:需要局域网以总线型接入,就是有一根线连接所有的终端。
- 载波监听与冲突检测:终端在发送前和发送中,需要不断检测信道有没有消息。当发送前有消息,就停止发送,直到没消息;发送时检测到了消息,就继续监听,等到没消息了重新发送自己的消息。
不再讨论监听时间(5μs),考研的同学请另找文章学习。由于我不是偏底层的网络工程师,所以这里只谈上面这些算法问题即可。
以太网的MAC帧
FCS是利用CRC进行校验。
MAC地址是物理地址,是一个唯一的地址信息,标志着唯一的硬件ID。MAC地址占6字节。我记得本科时有一个同学问,既然有了MAC地址为什么还要IP地址?老师表示教了这么多年,没听过这样的问题hhh。
这个问题很好解决:为什么我们每个人都有身份证号,还要有家庭住址?一个是为了知道你是谁,一个是为了找到你。
最后一个重要的知识点,就是不同的网络是由路由器连接的,同一个网络不同主机使用桥接器或者集线器连接,构成一个局域网。
ARP协议
啥是ARP协议呢?这是一个地址解析协议,就是从IP地址转换成MAC地址。ARP协议并不是一个算法协议,而是规定了一个数据表可以查询。在原始的ARP中,只有IP转MAC,MAC转IP的过程是RARP协议,但是现在ARP中既有IP转MAC,也有MAC转IP。
ARP协议被用在IP协议中,因此有些教科书将其划分在网络层协议;然而ARP协议又是解析MAC地址的协议,它又可以被划分成数据链路层协议。这种分类不重要。
我们之前说,ARP协议不是一个算法协议,因为IP地址与MAC地址并不存在简单的逻辑转换。ARP协议说的是,在主机ARP高速缓存中存放一个从IP地址到MAC地址的映射表,该表会动态的增加或者删除。在发送IP包的时候,会从ARP表中找到IP地址,并查看其MAC地址,封装成MAC帧。如果找不到,比方说某主机刚插电,ARP是空的,就会向局域网发送ARP请求分组。这个ARP请求分组是广播的,但是ARP回应是单播的。那么谁回应的?找谁谁回应。A找B,会向同局域网的B,C,D,E,F发送广播,找到MAC地址为B的主机,然后只有B回应。
也就是说,ARP协议解决的是同局域网的的地址解析问题,而非广域网。因此,在广域网上需要使用路由协议结合ARP使用。