注:内容根据《计算机网络第七版》以及相关PPT整理制作,图片主要源于{电子工程出版社},部分图片源于学校老师上课所画的图以及自己制作的思维导图

概述

首先看看不同定义下的计算机网络体系结构

image-20210412184905304

在OSI和五层协议里面,数据链路层都在其中扮演着重要的角色,在TCP/IP的体系结构里,数据链路层及以下则被抽象掉了

数据链路层是实现设备之间通信的非常重要的一层,不管经过的是什么网络,电话网、局域网、广域网等,需要注意的是:在里面,路由器在转发分组时只用到下三层协议

image-20210412185205003

再来看看处于交换机下的数据链路层

image-20210412185623966

若主机H1向H2发送数据,则实际上数据的流动是通过五层从左向右,从上向下传递过去的,但若只从数据链路层来看的话,数据是从H1→R1→R2→R2→R3→H2的链路层传过去的

image-20210412185733062

数据链路层使用的信道主要有以下两种类型

(a) 点对点信道:这种信道使用一对一的点对点通信方式。

image-20210412190326192

(b) 广播信道:使用一对多的广播通信方式。必须使用专用的共享信道协议来协调这些主机的数据发送。

image-20210412190337871

使用点对点信道的数据链路层

数据链路和帧

链路和数据链路的区别

链路 (link) 是一条无源的点到点的物理线路段,中间没有任何其他的交换结点。
简单来说:一条链路只是一条通路的一个组成部分。

数据链路 (data link) 除了物理线路外,还必须有通信协议来控制这些数据的传输。若把实现这些协议的硬件和软件加到链路上,就构成了数据链路。

现在最常用的方法是使用适配器(即网卡)来实现这些协议的硬件和软件。一般的适配器都包括了数据链路层和物理层这两层的功能。

也有人采用另外的术语。这就是把链路分为物理链路逻辑链路
物理链路就是上面所说的链路。逻辑链路就是上面的数据链路,是物理链路加上必要的通信协议。

早期的数据通信协议曾叫做通信规程 (procedure)。因此在数据链路层,规程和协议是同义语

数据链路层传送的是帧

数据链路层通过将网络层传下来的ip数据包进行封装成帧然后再传给物理层,如下图所示

image-20210412191405152

通常,我们会在两个对等的数据链路层之间画出一个数字管道,而在这条数字管道上传输的数据单位是帧。

image-20210412191726824

数据链路层不必考虑物理层如何实现比特传输的细节。甚至还可以更简单地设想好像是沿着两个数据链路层之间的水平方向把帧直接发送到对方。在之后的学习也是一样,随着往上层的学习,有时候为了屏蔽掉下层带给自己的干扰,我们大多时候会直接考虑数据是在对等层之间进行传递(实际上并不是)

数据链路层协议有许多种,但有三个基本问题则是共同的。这三个基本问题是:

  1. 封装成帧
  2. 透明传输
  3. 差错控制

封装成帧

封装成帧 (framing) 就是在一段数据的前后分别添加首部和尾部,然后就构成了一个帧。

首部和尾部的一个重要作用就是进行帧定界。

image-20210412194144658

当数据是由可打印的 ASCII 码组成的文本文件时,帧定界可以使用特殊的帧定界符。

控制字符 SOH (Start Of Header) 放在一帧的最前面,表示帧的首部开始。另一个控制字符 EOT (End Of Transmission) 表示帧的结束。

image-20210412194215116

如果数据中的某个字节的二进制代码恰好和 SOH 或 EOT 一样,数据链路层就会错误地“找到帧的边界”。

image-20210412194504407

为啥会出现这种情况呢,因为数据链路层在传递数据的时候是“透明”的,即透明传输

透明传输

透明:指某一个实际存在的事物看起来却好像不存在一样。(想象一个完全透明的玻璃在你面前)

“在数据链路层透明传送数据”表示无论发送什么样的比特组合的数据,这些数据都能够按照原样没有差错地通过这个数据链路层。这便是透明传输,也就是说,对面的数据链路层也会去解析你的整个帧,一不小心解析到了本存在于数据而不是帧定界的EOT时,就会误认终止而抛弃掉后面的帧

解决方法:字节填充 (byte stuffing)字符填充 (character stuffing)

发送端的数据链路层在数据中出现控制字符“SOH”或“EOT”的前面插入一个转义字符“ESC”(其十六进制编码是1B)。接收端的数据链路层在将数据送往网络层之前删除插入的转义字符。如果转义字符也出现在数据当中,那么应在转义字符前面插入一个转义字符 ESC。当接收端收到连续的两个转义字符时,就删除其中前面的一个。

image-20210412195139392

差错检错

在传输过程中可能会产生比特差错:1 可能会变成 0, 而 0 也可能变成 1。

image-20210412195225962

在一段时间内,传输错误的比特占所传输比特总数的比率称为误码率 BER (Bit Error Rate)。

误码率与信噪比有很大的关系。

为了保证数据传输的可靠性,在计算机网络传输数据时,必须采用各种差错检测措施。 下面介绍一种检测措施——循环循环冗余检验码

循环冗余检验 CRC

在数据链路层传送的帧中,广泛使用了循环冗余检验 CRC检错技术。

image-20210412195833103

在发送端,先把数据划分为组。假定每组 k 个比特。

在每组 M 后面再添加供差错检测用的 n 位冗余码,然后一起发送出去。

冗余码的计算

用二进制的模 2 运算进行 2n 乘数据M 的运算,这相当于在 M 后面添加 n 个 0

得到的 (k + n) 位的数除以事先选定好的长度为 (n + 1) 位的除数 P,得出商是 Q 而余数是 R,余数 R 比除数 P 少 1 位,即 R 是 n 位。

将余数 R 作为冗余码拼接在数据 M 后面,一起发送出去。

image-20210412200326411

接收端会对收到的每一帧进行 CRC 检验

(1) 若得出的余数 R = 0,则判定这个帧没有差错,就接受 (accept)。

(2) 若余数 R ≠ 0,则判定这个帧有差错,就丢弃。
但这种检测方法并不能确定究竟是哪一个或哪几个比特出现了差错。

只要经过严格的挑选,并使用位数足够多的除数 P,那么出现检测不到的差错的概率就很小很小。

冗余码的计算举例

现在 k = 6, M = 101001。
设 n = 3, 除数 P = 1101,
被除数是 2的n次*M = 101001000。
模 2 运算的结果是:商 Q = 110101,余数 R = 001。
把余数 R 作为冗余码添加在数据 M 的后面发送出去。发送的数据是:2nM + R,即:101001001,共 (k + n) 位。

image-20210412200553273

帧检验序列 FCS

在数据后面添加上的冗余码称为帧检验序列 FCS (Frame Check Sequence)。

循环冗余检验 CRC 和帧检验序列 FCS 并不等同。
CRC 是一种常用的检错方法,而 FCS 是添加在数据后面的冗余码。
FCS 可以用 CRC 这种方法得出,但 CRC 并非用来获得 FCS 的唯一方法。

最后应当注意:仅用循环冗余检验 CRC 差错检测技术只能做到无差错接受 (accept)。

“无差错接受”是指:“凡是接受的帧(即不包括丢弃的帧),我们都能以非常接近于 1 的概率认为这些帧在传输过程中没有产生差错”。
也就是说:“凡是接收端数据链路层接受的帧都没有传输差错”(有差错的帧就丢弃而不接受)。单纯使用 CRC 差错检测技术不能实现“无差错传输”或“可靠传输”。

应当明确,“无比特差错”“无传输差错”是不同的概念。在数据链路层使用 CRC 检验,能够实现无比特差错的传输,但这还不是可靠传输。要做到“无差错传输”(即发送什么就收到什么)就必须再加上确认和重传机制。 本章介绍的数据链路层协议都不是可靠传输的协议。

点对点协议 PPP

PPP 协议的特点

对于点对点的链路,目前使用得最广泛的数据链路层协议是点对点协议 PPP (Point-to-Point Protocol)。

PPP 协议在 1994 年就已成为互联网的正式标准。

用户到 ISP 的链路使用 PPP 协议

用户到ISP的链路使用PPP协议

PPP 协议应满足的需求

  1. 简单 —— 这是首要的要求。
  2. 封装成帧 —— 必须规定特殊的字符作为帧定界符。
  3. 透明性 —— 必须保证数据传输的透明性。
  4. 多种网络层协议 —— 能够在同一条物理链路上同时支持多种网络层协议。
  5. 多种类型链路 —— 能够在多种类型的链路上运行。
  6. 差错检测 —— 能够对接收端收到的帧进行检测,并立即丢弃有差错的帧。
  7. 检测连接状态 —— 能够及时自动检测出链路是否处于正常工作状态。
  8. 最大传送单元 —— 必须对每一种类型的点对点链路设置最大传送单元 MTU 的标准默认值,促进各种实现之间的互操作性。
  9. 网络层地址协商 —— 必须提供一种机制使通信的两个网络层实体能够通过协商知道或能够配置彼此的网络层地址。
  10. 数据压缩协商 —— 必须提供一种方法来协商使用数据压缩算法。

PPP 协议有三个组成部分:

  1. 一个将 IP 数据报封装到串行链路的方法。
  2. 链路控制协议 LCP (Link Control Protocol)。
  3. 网络控制协议 NCP (Network Control Protocol)。

PPP 协议的帧格式

PPP 帧的首部和尾部分别为 4 个字段和 2 个字段。

标志字段 F = 0x7E (符号“0x”表示后面的字符是用十六进制表示。十六进制的 7E 的二进制表示是 01111110)。

地址字段 A 只置为 0xFF。地址字段实际上并不起作用。
控制字段 C 通常置为 0x03。

PPP 是面向字节的,所有的 PPP 帧的长度都是整数字节。

image-20210412202618347

PPP 有一个 2 个字节的协议字段。其值
若为 0x0021,则信息字段就是 IP 数据报。
若为 0x8021,则信息字段是网络控制数据。
若为 0xC021,则信息字段是 PPP 链路控制数据。
若为 0xC023,则信息字段是鉴别数据。

PPP在透明传输的相关问题

当 PPP 用在异步传输时,就使用一种特殊的字符填充法
当 PPP 用在同步传输链路时,协议规定采用硬件来完成比特填充(和 HDLC 的做法一样)。

字符填充法

将信息字段中出现的每一个 0x7E 字节转变成为 2 字节序列 (0x7D, 0x5E)。

若信息字段中出现一个 0x7D 的字节, 则将其转变成为 2 字节序列 (0x7D, 0x5D)。

若信息字段中出现 ASCII 码的控制字符(即数值小于 0x20 的字符),则在该字符前面要加入一个 0x7D 字节,同时将该字符的编码加以改变。

image-20210412202818142

零比特填充

PPP 协议用在 SONET/SDH 链路时,使用同步传输(一连串的比特连续传送)。这时 PPP 协议采用零比特填充方法来实现透明传输。

在发送端,只要发现有 5 个连续 1,则立即填入一个 0。

接收端对帧中的比特流进行扫描。每当发现 5 个连续1时,就把这 5 个连续 1 后的一个 0 删除。

image-20210412202911660

PPP是不提供使用序号和确认的可靠传输的,为什么呢,原因如下

  1. 在数据链路层出现差错的概率不大时,使用比较简单的 PPP 协议较为合理。
  2. 在因特网环境下,PPP 的信息字段放入的数据是 IP 数据报。数据链路层的可靠传输并不能够保证网络层的传输也是可靠的。
  3. 帧检验序列 FCS 字段可保证无差错接受。

PPP 协议的工作状态

当用户拨号接入 ISP 时,路由器的调制解调器对拨号做出确认,并建立一条物理连接。

PC 机向路由器发送一系列的 LCP 分组(封装成多个 PPP 帧)。

这些分组及其响应选择一些 PPP 参数,并进行网络层配置,NCP 给新接入的 PC 机分配一个临时的 IP 地址,使 PC 机成为因特网上的一个主机。

通信完毕时,NCP 释放网络层连接,收回原来分配出去的 IP 地址。接着,LCP 释放数据链路层连接。最后释放的是物理层的连接。

可见,PPP 协议已不是纯粹的数据链路层的协议,它还包含了物理层和网络层的内容。

image-20210412203110510

使用广播信道的数据链路层

局域网的数据链路层

局域网最主要的特点是:网络为一个单位所拥有;地理范围和站点数目均有限。

局域网具有如下主要优点:

  1. 具有广播功能,从一个站点可很方便地访问全网。局域网上的主机可共享连接在局域网上的各种硬件和软件资源。
  2. 便于系统的扩展和逐渐地演变,各设备的位置可灵活调整和改变。
  3. 提高了系统的可靠性、可用性和残存性。

image-20210412203528660

一开始因为技术原因,没办法制造出廉价的集线器,所以采用的是总线型的局域网,这样的类型有着如下特点:各个主机是在一同条信道上进行通信的,使用一对多的广播通信方式。

image-20210412203948749

但是它存在着问题:若多个设备在共享的广播信道上同时发送数据,则会造成彼此干扰,导致发送失败。

共享信道要考虑的便是如何让众多用户能够合理方便的共享通信媒体资源,总的分为两种方法

  1. 静态划分信道(物理层)

    • 频分复用
    • 时分复用
    • 波分复用
    • 码分复用
  2. 动态媒体接入控制(多点接入)

    • 随机接入
    • 受控接入 ,如多点线路探询 (polling),或轮询。

以太网的两个标准

DIX Ethernet V2 是世界上第一个局域网产品(以太网)的规约。
IEEE 802.3 是第一个 IEEE 的以太网标准。

DIX Ethernet V2 标准与 IEEE 的 802.3 标准只有很小的差别,因此可以将 802.3 局域网简称为“以太网”。

严格说来,“以太网”应当是指符合 DIX Ethernet V2 标准的局域网 。

数据链路层的两个子层

为了使数据链路层能更好地适应多种局域网标准,IEEE 802 委员会就将局域网的数据链路层拆成两个子层:

  1. 逻辑链路控制 LLC (Logical Link Control)子层;

  2. 媒体接入控制 MAC (Medium Access Control)子层。

与接入到传输媒体有关的内容都放在 MAC子层,而 LLC 子层则与传输媒体无关。不管采用何种协议的局域网,对 LLC 子层来说都是透明的(有点像TCP/IP协议)。

image-20210412204812504

由于 TCP/IP 体系经常使用的局域网是 DIX Ethernet V2 而不是802.3 标准中的几种局域网,因此现在 802 委员会制定的逻辑链路控制子层 LLC(即 802.2 标准)的作用已经不大了。很多厂商生产的适配器上就仅装有 MAC 协议而没有 LLC 协议。

适配器(网卡)

网络接口板又称为通信适配器 (adapter) 或网络接口卡 NIC (Network Interface Card),或“网卡”。

适配器的重要功能:

  1. 进行串行/并行转换。
  2. 对数据进行缓存。
  3. 在计算机的操作系统安装设备驱动程序。
  4. 实现以太网协议。

image-20210412204941268

当适配器收到正确的帧时,它就会使用中断来通知计算机,并交付给协议栈中的网络层;这里值得注意的是:当收到的是有差错的帧时,适配器会直接丢掉该帧而不会去通知计算机。当计算机要发送ip数据包时,就由协议栈把IP数据包下交给适配器,组装成帧后发送到局域网。

CSMA/CD 协议

最初的以太网是将许多计算机都连接到一根总线上。易于实现广播通信。当初认为这样的连接方法既简单又可靠,因为总线上没有有源器件(当时普遍认为有源器件不可靠,无源的电缆线才是最可靠的)。

为了实现一对一通信,将接收站的硬件地址写入帧首部中的目的地址字段中。仅当数据帧中的目的地址与适配器的硬件地址一致时,才能接收这个数据帧。比如下图中的B向D发送数据

image-20210412205728382

总线当然也有缺点。就像前面说的,若多台计算机或多个站点同时发送时,会产生发送碰撞或冲突,导致发送失败。

image-20210412205830005

在讨论解决冲突或碰撞的方法前,先来看看以太网采取的两种重要的措施

(1) 采用较为灵活的无连接的工作方式

不必先建立连接就可以直接发送数据。对发送的数据帧不进行编号,也不要求对方发回确认。这样做的理由是局域网信道的质量很好,因信道质量产生差错的概率是很小的。

以太网提供的服务是不可靠的交付,即尽最大努力的交付。当目的站收到有差错的数据帧时就丢弃此帧,其他什么也不做。差错的纠正由高层来决定。

而如果高层发现丢失了一些数据而进行重传,此时以太网并不知道这是一个重传的帧,而是当作一个新的数据帧来发送。

(2) 以太网发送的数据都使用曼彻斯特 (Manchester) 编码

image-20210412210100341

曼彻斯特编码缺点是:它所占的频带宽度比原始的基带信号增加了一倍。

下面就介绍碰撞或冲突的解决方法

CSMA/CD 协议要点(多点接入、载波监听、碰撞检测)

CSMA/CD 含义:载波监听多点接入 / 碰撞检测 (Carrier Sense Multiple Access with Collision Detection) 。

“多点接入”表示许多计算机以多点接入的方式连接在一根总线上。

“载波监听”是指每一个站在发送数据之前先要检测一下总线上是否有其他计算机在发送数据,如果有,则暂时不要发送数据,以免发生碰撞。

总线上并没有什么“载波”。因此, “载波监听”就是用电子技术检测总线上有没有其他计算机发送的数据信号。

实际上,不管在发送前还是发送中,每个站必须不停地检测信道,那么在发送中站是如何检测的呢?

“碰撞检测”就是站在发送数据过程中对信道进行监听的操作

“碰撞检测”就是计算机边发送数据边检测信道上的信号电压大小。
当几个站同时在总线上发送数据时,总线上的信号电压摆动值将会增大(互相叠加)。

当一个站检测到的信号电压摆动值超过一定的门限值时,就认为总线上至少有两个站同时在发送数据,表明产生了碰撞。

所谓“碰撞”就是发生了冲突。因此“碰撞检测”也称为“冲突检测”。

在发生碰撞时,总线上传输的信号产生了严重的失真,无法从中恢复出有用的信息来。

每一个正在发送数据的站,一旦发现总线上出现了碰撞,就要立即停止发送,免得继续浪费网络资源,然后等待一段随机时间后再次发送。

CSMA/CD协议工作流程如下图

image-20210412224725977

为何要进行碰撞检测? 因为信号传播时延对载波监听产生了影响,比如你现在在开会,两个人都想发言,但你们都克制住了,因为有另一个人在发言,这时候你们采用的便是载波监听,等到他讲完了,你们两载波监听没有监听到有人在说话准备想讲时,你讲了出来,结果巧了,他也同时讲了出来,两句话便在传播上起了冲突,看似同个时间讲的,其实可能是你早了那么几毫秒讲,但同时他的载波监听刚返回确认没有声音传出,他也开讲。而在这时候,如果你们不在讲的时候采取碰撞检测,一方停止讲话,那么你们两个人的声音就会彼此“吵架”

image-20210412224847718

最先发送数据帧的站,在发送数据帧后至多经过时间 2r (两倍的端到端往返时延)就可知道发送的数据帧是否遭受了碰撞。

以太网的端到端往返时延 2r 称为争用期,或碰撞窗口。

经过争用期这段时间还没有检测到碰撞,才能肯定这次发送不会发生碰撞。

截断二进制指数退避算法

以太网使用截断二进制指数退避算法来确定碰撞后重传的时机

发生碰撞的站在停止发送数据后,要推迟(退避)一个随机时间才能再发送数据。

  1. 基本退避时间取为争用期 2я。

  2. 从整数集合 [0, 1, … , (2k - 1)] 中随机地取出一个数,记为 r。重传所需的时延就是 r 倍的基本退避时间。

  3. 参数 k 按下面的公式计算:

    k = Min[重传次数, 10]

  4. 当 k ≤10 时,参数 k 等于重传次数。

  5. 当重传达 16 次仍不能成功时即丢弃该帧,并向高层报告。

举个栗子
第 1 次冲突重传时:
k = 1,r 为 {0,1} 集合中的任何一个数。
第 2 次冲突重传时:
k = 2,r 为 {0,1,2,3} 集合中的任何一个数。
第 3 次冲突重传时:
k = 3,r 为 {0,1,2,3,4,5,6,7} 集合中的任何一个数。

10 Mbit/s 以太网争用期的长度

10 Mbit/s 以太网取 51.2μs 为争用期的长度。
对于 10 Mbit/s 以太网,以太网规定了最短有效帧长为 64 字节,在争用期内可发送 512 bit(即 64 字节)。所以凡长度小于 64 字节的帧都是由于冲突而异常中止的无效帧

这意味着:
以太网在发送数据时,若前 64 字节没有发生冲突,则后续的数据就不会发生冲突。

如果发生冲突,就一定是在发送的前 64 字节之内。
由于一检测到冲突就立即中止发送,这时已经发送出去的数据一定小于 64 字节。

覆盖范围

在 10 Mbit/s 以太网 51.2 μs 的争用期内,信号能传输多远的距离?

以太网上最大的端到端单程时延必须小于争用期的一半(即 25.6 μs),这相当于以太网的最大端到端长度约为 5 km。

强化碰撞

当发送数据的站一旦发现发生碰撞时,除了立即停止发送数据外,还要继续发送32比特或48比特的人为干扰信号,以让所有用户都知道已经发生了碰撞

注意:B 也能够检测到冲突,并立即停止发送数据帧,接着就发送干扰信号。
这里为了简单起见,只画出 A 发送干扰信号的情况。

image-20210413150301732

CSMA/CD 协议的重要特性

  1. 使用 CSMA/CD 协议的以太网不能进行全双工通信而只能进行双向交替通信(半双工通信)
  2. 每个站在发送数据之后的一小段时间内,存在着遭遇碰撞的可能性。
  3. 这种发送的不确定性使整个以太网的平均通信量远小于以太网的最高数据率。

下面是该协议整个过程的流程图

image-20210413150725543

使用集线器的星形拓扑

传统以太网最初是使用粗同轴电缆,后来演进到使用比较便宜的细同轴电缆,最后发展为使用更便宜和更灵活的双绞线。

采用双绞线的以太网采用星形拓扑,在星形的中心则增加了一种可靠性非常高的设备,叫做集线器 (hub)

传统的总线拓扑结构(前面详细讲过了)

image-20210413152754451

使用集线器的双绞线以太网,如下图

image-20210413152825307

星形以太网 10BASE-T

10BASE-T特点如下

  1. 使用无屏蔽双绞线,采用星形拓扑。
  2. 每个站需要用两对双绞线,分别用于发送和接收。
  3. 双绞线的两端使用 RJ-45 插头。
  4. 集线器使用了大规模集成电路芯片,因此集线器的可靠性提高。
  5. 10BASE-T 的通信距离稍短,每个站到集线器的距离不超过 100m。

image-20210413153048104

这种 10 Mbit/s 速率的无屏蔽双绞线星形网的出现,既降低了成本,又提高了可靠性。 具有很高的性价比。

10BASE-T 双绞线以太网的出现,是局域网发展史上的一个非常重要的里程碑,它为以太网在局域网中的统治地位奠定了牢固的基础。从此以太网的拓扑就从总线形变为更加方便的星形网络,而以太网也就在局域网中占据了统治地位。

集线器特点

  1. 集线器是使用电子器件来模拟实际电缆线的工作,因此整个系统仍然像一个传统的以太网那样运行。
  2. 使用集线器的以太网在逻辑上仍是一个总线网,各工作站使用的还是 CSMA/CD 协议,并共享逻辑上的总线
  3. 集线器很像一个多接口的转发器,工作在物理层。
  4. 集线器采用了专门的芯片,进行自适应串音回波抵消,减少了近端串音。

结构图如下

image-20210413153248800

以太网的信道利用率

多个站在以太网上同时工作就可能会发生碰撞。当发生碰撞时,信道资源实际上是被浪费了。因此,当扣除碰撞所造成的信道损失后,以太网总的信道利用率并不能达到 100%。

假设я(该符号暂时找不到,所以统一用这个代替一下) 是以太网单程端到端传播时延。则争用期长度为 2я ,即端到端传播时延的两倍。检测到碰撞后不发送干扰信号。

设帧长为 L (bit),数据发送速率为 C (bit/s),则帧的发送时间为 T0 = L/C (s)。

image-20210413155601307

一个站在发送帧时出现了碰撞。经过一个争用期 2я 后,可能又出现了碰撞。这样经过若干个争用期后,一个站发送成功了。假定发送帧需要的时间是 T0。

通过图我们注意到,成功发送一个帧需要占用信道的时间是 T0 + я,比这个帧的发送时间要多一个单程端到端时延я。这是因为当一个站发送完最后一个比特时,这个比特还要在以太网上传播。在最极端的情况下,发送站在传输媒体的一端,而比特在媒体上传输到另一端所需的时间是я 。

因此,必须经过时间T0 + я后以太网的媒体才处于完全空闲状态

我们在以太网中定义了参数 a ,它是以太网单程端到端时延я与帧的发送时间 T0 之比:

image-20210413155822743

通过公式我们可以知道:要提高以太网的信道利用率,就必须减小я与 T0 之比。

a → 0,表示一发生碰撞就立即可以检测出来, 并立即停止发送,因而信道利用率很高。
a 越大,表明争用期所占的比例增大,每发生一次碰撞就浪费许多信道资源,使得信道利用率明显降低。

为提高利用率,以太网的参数 a 的值应当尽可能小些。
对以太网参数 a 的要求是:当数据率一定时,以太网的连线的长度受到限制,否则я的数值会太大。以太网的帧长不能太短,否则 T0 的值会太小,使 a 值太大。

在理想化的情况下,以太网上的各站发送数据都不会产生碰撞(这显然已经不是 CSMA/CD,而是需要使用一种特殊的调度方法),即总线一旦空闲就有某一个站立即发送数据。
发送一帧占用线路的时间是 T0 + я ,而帧本身的发送时间是 T0。于是,我们可计算出理想情况下的极限信道利用率 Smax 为:

image-20210413160220692

只有当参数 a 远小于 1 才能得到尽可能高的极限信道利用率。
据统计,当以太网的利用率达到 30% 时就已经处于重载的情况。很多的网络容量被网上的碰撞消耗掉了。

以太网的 MAC 层

MAC 层的硬件地址

在局域网中,硬件地址又称为物理地址,或 MAC 地址。

802 标准所说的“地址”严格地讲应当是每一个站的“名字”或标识符。

请注意,如果连接在局域网上的主机或路由器安装有多个适配器,那么这样的主机或路由器就有多个“地址”。更准确些说,这种 48 位“地址”应当是某个接口的标识符。

IEEE 802 标准规定 MAC 地址字段可采用 6 字节 ( 48位) 或 2 字节 ( 16 位) 这两种中的一种。
IEEE 的注册管理机构 RA 负责向厂家分配地址字段 6 个字节中的前三个字节 (即高位 24 位),称为组织唯一标识符。
地址字段 6 个字节中的后三个字节 (即低位 24 位) 由厂家自行指派,称为扩展唯一标识符,必须保证生产出的适配器没有重复地址。

image-20210413161124465

所以,一个地址块可以生成 224 个不同的地址。这种 48 位地址称为 MAC-48,它的通用名称是 EUI-48。
生产适配器时,6 字节的 MAC 地址已被固化在适配器的 ROM,因此,MAC 地址也叫做硬件地址 (hardware address) 或物理地址。
“MAC 地址”实际上就是适配器地址或适配器标识符 EUI-48。

单站地址,组地址,广播地址

IEEE 规定地址字段的第一字节的最低位为 I/G 位。I/G 表示 Individual / Group。

当 I/G 位 = 0 时,地址字段表示一个单站地址

当 I/G 位 = 1 时,表示组地址,用来进行多播(以前曾译为组播)。此时,IEEE 只分配地址字段前三个字节中的 23 位。

当 I/G 位分别为 0 和 1 时,一个地址块可分别生成 223 个单个站地址和 223 个组地址。

所有 48 位都为 1 时,为广播地址。只能作为目的地址使用。

全球管理与本地管理

IEEE 把地址字段第一字节的最低第 2 位规定为 G/L 位,表示 Global / Local。

当 G/L 位 = 0 时,是全球管理(保证在全球没有相同的地址),厂商向 IEEE 购买的 OUI 都属于全球管理。

当 G/L 位 = 1 时, 是本地管理,这时用户可任意分配网络上的地址。

适配器检查 MAC 地址

适配器从网络上每收到一个 MAC 帧就首先用硬件检查 MAC 帧中的 MAC 地址。如果是发往本站的帧则收下,然后再进行其他的处理。
否则就将此帧丢弃,不再进行其他的处理。

“发往本站的帧”包括以下三种帧:

  1. 单播 (unicast) 帧(一对一)
  2. 广播 (broadcast) 帧(一对全体)
  3. 多播 (multicast) 帧(一对多)

所有的适配器都至少能够识别前两种帧,即能够识别单播地址和广播地址。有的适配器可用编程方法识别多播地址。

只有目的地址才能使用广播地址和多播地址。

混杂方式 (promiscuous mode) 工作的以太网适配器只要“听到”有帧在以太网上传输就都接收下来。

MAC 帧的格式

常用的以太网 MAC 帧格式有两种标准:
DIX Ethernet V2 标准
IEEE 的 802.3 标准

以太网V2标准下的MAC帧

最常用的 MAC 帧是以太网 V2 的格式。下面就来讲解以太网V2标准下的MAC帧

image-20210413161523396

其中,目的地址和源地址都是6字节,类型字段用来标志上一层使用的是什么协议,以便把收到的 MAC 帧的数据上交给上一层的这个协议。

数据字段的正式名称是 MAC 客户数据字段。
最小长度 64 字节 - 18 字节的首部和尾部 = 数据字段的最小长度(46字节)

当传输媒体的误码率为 1x10-8 时,MAC 子层可使未检测到的差错小于 1x10-14 。

注意:当数据字段的长度小于 46 字节时,应在数据字段的后面加入整数字节的填充字段,以保证以太网的 MAC 帧长不小于 64 字节。

在帧的前面插入(硬件生成)的 8 字节中,第一个字段共 7 个字节,是前同步码,用来迅速实现 MAC 帧的比特同步。第二个字段 1 个字节是帧开始定界符,表示后面的信息就是 MAC 帧。

最后,为了达到比特同步,在传输媒体上实际传送的要比 MAC 帧还多 8 个字节

无效的 MAC 帧

无效的MAC帧主要有以下特点

  • 数据字段的长度与长度字段的值不一致;
  • 帧的长度不是整数个字节;
  • 用收到的帧检验序列 FCS 查出有差错;
  • 数据字段的长度不在 46 ~ 1500 字节之间。

有效的 MAC 帧长度为 64 ~ 1518 字节之间。

怎么解决这些无效的帧,对的,丢掉,前面有提到过

对于检查出的无效 MAC 帧就简单地丢弃。以太网不负责重传丢弃的帧。

IEEE 802.3 MAC 帧

下面再来讲讲IEEE 802.3 MAC 帧格式

与以太网 V2 MAC 帧格式相似,区别在于:

  1. IEEE 802.3 规定的 MAC 帧的第三个字段是“长度 / 类型”
    1. 当这个字段值大于 0x0600 时(相当于十进制的 1536),就表示“类型”。这样的帧和以太网 V2 MAC 帧完全一样。
    2. 当这个字段值小于 0x0600 时才表示“长度”。
  2. 当“长度/类型”字段值小于 0x0600 时,数据字段必须装入上面的逻辑链路控制 LLC 子层的 LLC 帧。

让我们再搬出V2 MAC帧的图进行对比

image-20210413161523396

现在市场上流行的都是以太网 V2 的 MAC 帧,但大家也常常把它称为 IEEE 802.3 标准的 MAC 帧。

帧间最小间隔为 9.6 μs,相当于 96 bit 的发送时间。
一个站在检测到总线开始空闲后,还要等待 9.6 μs 才能再次发送数据。

这样做是为了使刚刚收到数据帧的站的接收缓存来得及清理,做好接收下一帧的准备。

扩展的以太网

在物理层扩展以太网

有两种方式可以对以太网进行扩展

  • 使用光纤扩展
    主机使用光纤(通常是一对光纤)和一对光纤调制解调器连接到集线器。 很容易使主机和几公里以外的集线器相连接。

    image-20210413163939949

  • 使用集线器扩展:将多个以太网段连成更大的、多级星形结构的以太网。

    image-20210413164058671

使用集线器扩展以太网的优缺点有啥

优点

  1. 使原来属于不同碰撞域的以太网上的计算机能够进行跨碰撞域的通信。

  2. 扩大了以太网覆盖的地理范围。

缺点

  1. 碰撞域增大了,但总的吞吐量并未提高。
  2. 如果不同的碰撞域使用不同的数据率,那么就不能用集线器将它们互连起来。

这里的碰撞域是什么意思

碰撞域(collision domain)又称为冲突域,是指网络中一个站点发出的帧会与其他站点发出的帧产生碰撞或冲突的那部分网络。碰撞域越大,发生碰撞的概率越高。

image-20210413165236969

这样,即使你使用了多个集线器,但其实它们还是属于同个碰撞域,也就是说,在每个碰撞域里只能由一个站再发送数据,这样吞吐量和一个集线器形成的碰撞域是一样的。

接下来再来讲讲一种更高效的方法——交换机

在数据链路层扩展以太网

以太网交换机

扩展以太网更常用的方法是在数据链路层进行。早期使用网桥,现在使用以太网交换机。

image-20210413165441193

网桥工作在数据链路层。它根据 MAC 帧的目的地址对收到的帧进行转发和过滤。
当网桥收到一个帧时,并不是向所有的接口转发此帧,而是先检查此帧的目的 MAC 地址,然后再确定将该帧转发到哪一个接口,或把它丢弃。

以太网交换机实质上就是一个多接口的网桥。通常都有十几个或更多的接口。每个接口都直接与一个单台主机或另一个以太网交换机相连,并且一般都工作在全双工方式。以太网交换机具有并行性。能同时连通多对接口,使多对主机能同时通信。

相互通信的主机都是独占传输媒体,都能进行无碰撞地传输数据。

image-20210413165626642

这样,以太网交换机的每个接口是一个碰撞域,吞吐量相比较单纯集线器大大提高

以太网交换机特点、优点

以太网交换机具有怎样的特点呢

  • 以太网交换机的接口有存储器,能在输出端口繁忙时把到来的帧进行缓存
  • 以太网交换机是一种即插即用设备,其内部的帧交换表(又称为地址表)是通过自学习算法自动地逐渐建立起来的。
  • 以太网交换机使用了专用的交换结构芯片,用硬件转发,其转发速率要比使用软件转发的网桥快很多。
  • 以太网交换机的性能远远超过普通的集线器,而且价格并不贵。

通过上面的介绍,让我们来看看以太网交换机具有怎样的优点

  1. 用户独享带宽,增加了总容量。

    image-20210413170307329

  2. 从共享总线以太网转到交换式以太网时,所有接入设备的软件和硬件、适配器等都不需要做任何改动。

  3. 以太网交换机一般都具有多种速率的接口,方便了各种不同情况的用户。

以太网交换机的交换方式

  1. 存储转发方式
    把整个数据帧先缓存后再进行处理

  2. 直通 (cut-through) 方法
    接收数据帧的同时就立即按数据帧的目的 MAC 地址决定该帧的转发接口,因而提高了帧的转发速度。

    缺点是它不检查差错就直接将帧转发出去,因此有可能也将一些无效帧转发给其他的站。

image-20210413170618836

在某些情况下,仍需要采用基于软件的存储转发方式进行交换,例如,当需要进行线路速率匹配、协议转换或差错检测时。

以太网交换机的自学习功能

多图预警,通过多个图来描述以太网交换机自学习过程

开始时,交换表是空的

image-20210413170859854

然后A 先向 B 发送一帧。该帧从接口 1 进入到交换机。

交换机收到帧后,先查找交换表。没有查到应从哪个接口转发这个帧给 B。

交换机把这个帧的源地址 A 和接口 1 写入交换表中。

image-20210413170932553

交换机向除接口 1 以外的所有的接口广播这个帧。

由于与该帧的目的地址不相符,C 和 D 将丢弃该帧。

image-20210413171303606

B 向 A 发送一帧。该帧从接口 3 进入到交换机。

交换机收到帧后,先查找交换表。发现交换表中的 MAC 地址有 A,表明要发送给A的帧应从接口1转发出去。于是就把这个帧传送到接口 1 转发给 A。

交换机把这个帧的源地址 B 和接口 3 写入交换表中。

image-20210413171342002

最后,考虑到可能有时要在交换机的接口更换主机,或者主机要更换其网络适配器,这就需要更改交换表中的项目。为此,在交换表中每个项目都设有一定的有效时间过期的项目就自动被删除

以太网交换机的这种自学习方法使得以太网交换机能够即插即用,不必人工进行配置,因此非常方便。

最后,通过一张图来归纳交换机自学习和转发帧的步骤归纳

image-20210413171701153

测验

来啦,小测验

假设:A 向 B 发送了一帧,C 向 E 发送了一帧,E 向 A 发送了一帧。
请分析:此时,S1 和 S2 的交换表内容分别是什么?

image-20210413172314284

答案如下

S1表

MAC地址 接口 有效时间
A 1
B 3
E 5

s2表

MAC地址 接口 有效时间
A 5
B 5
E 1

回路

现在来看看交换机存在的一个问题

假定开始时,交换机 S1 和 S2 的交换表都是空的。
主机 A 向主机 E 发送一帧。交换机在没有交换表的情况下会对其进行广播,让我们看看其中一个数据的流动线路情况,从交换机S1接口5出发,到另一个交换机S2,再次广播,其中一条路跑到接口6,然后又跑回交换机S1,再进行广播,其中一条跑到接口5,如此循环下去,便形成了回路

交换机回路

怎么解决:生成树协议 STP

IEEE 802.1D 标准制定了一个生成树协议 STP (Spanning Tree Protocol)
其要点是:不改变网络的实际拓扑,但在逻辑上则切断某些链路,使得从一台主机到所有其他主机的路径是无环路的树状结构,从而消除了兜圈子现象。

image-20210413173446655

从总线以太网到星形以太网

现在对以太网的发展历程进行总结

早期,以太网采用无源的总线结构。现在,采用以太网交换机的星形结构成为以太网的首选拓扑。总线以太网使用 CSMA/CD 协议,以半双工方式工作。以太网交换机不使用共享总线,没有碰撞问题,因此不使用 CSMA/CD 协议,以全双工方式工作。但仍然采用以太网的帧结构。

image-20210413165441193

CSMA/CD 协议下的局域网存在的以下几个方面的问题:

  1. 扩展性
  2. 安全性
  3. 可管理性 等

所有计算机都处于同一个碰撞域(或冲突域)中和同一个广播域中。

image-20210413173722363

image-20210413173806387

广播域(broadcast domain):指这样一部分网络,其中任何一台设备发出的广播通信都能被该部分网络中的所有其他设备所接收。

若采用以太网交换机的星形以太网

每个接口都处于一个独立的碰撞域(或冲突域)中,但所有计算机都处于同一个广播域中。

image-20210413174031621

image-20210413173947505

虚拟局域网

利用以太网交换机可以很方便地实现虚拟局域网 VLAN (Virtual LAN)。

IEEE 802.1Q 对虚拟局域网 VLAN 的定义:

虚拟局域网 VLAN 是由一些局域网网段构成的与物理位置无关的逻辑组,而这些网段具有某些共同的需求。每一个 VLAN 的帧都有一个明确的标识符,指明发送这个帧的计算机是属于哪一个 VLAN。

虚拟局域网其实只是局域网给用户提供的一种服务,而并不是一种新型局域网。

由于虚拟局域网是用户和网络资源的逻辑组合,因此可按照需要将有关设备和资源非常方便地重新组合,使用户从不同的服务器或数据库中存取所需的资源。

image-20210413174232906

这张图中,每个虚拟局域网是一个广播域。VLAN1, VLAN2 和 VLAN3 是三个不同的广播域。

当 B1 向 VLAN2 工作组内成员发送数据时,工作站 B2 和 B3 将会收到其广播的信息。而VLAN1 和 VLAN3 中的工作站 A1,A2 和 C1 等都不会收到 B1 发出的广播信息。

虚拟局域网限制了接收广播信息的工作站数,使得网络不会因传播过多的广播信息 (即“广播风暴”) 而引起性能恶化。

VLAN优点

虚拟局域网(VLAN)技术具有以下主要优点:

  1. 改善了性能
  2. 简化了管理
  3. 降低了成本
  4. 改善了安全性

划分虚拟局域网的方法

  • 基于交换机端口
  • 基于计算机网卡的MAC地址
  • 基于协议类型
  • 基于IP子网地址
  • 基于高层应用或服务

基于交换机端口

先讲讲基于交换机端口的方法:

最简单、也是最常用的方法。
属于在第一层划分虚拟局域网的方法。
缺点:不允许用户移动。

image-20210413174534860

基于计算机网卡的MAC地址的方法

根据用户计算机的MAC地址划分虚拟局域网。属于在第二层划分虚拟局域网的方法。允许用户移动。

缺点:需要输入和管理大量的MAC地址。如果用户的MAC地址改变了,则需要管理员重新配置VLAN。

image-20210413174643551

MAC 地址 VLAN
00-15-F5-CC-C8-14 10
C0-AB-D5-00-18-F4 10
C0-C5-18-DE-BC-E6 30

基于协议类型的方法

根据以太网帧的第三个字段“类型”字段确定该类型的协议属于哪一个虚拟局域网。
属于在第二层划分虚拟局域网的方法。

image-20210413175313847

“类型” VLAN
IP 10
IPX 30
……

基于IP子网地址的方法

根据以太网帧的第三个字段“类型”字段IP分组首部中的源 IP 地址字段确定该 IP 分组属于哪一个虚拟局域网。
属于在第三层(网络层)划分虚拟局域网的方法。

image-20210413175434466

IP 子网 VLAN
192.168.1.0/24 10
192.168.2.0/24 30
……

基于高层应用或服务的方法

根据高层应用或服务、或者它们的组合划分虚拟局域网。
更加灵活,但更加复杂。

image-20210413175556212

应用 VLAN
FTP 10
TELNET 30
……

虚拟局域网使用的以太网帧格式

IEEE 批准了 802.3ac 标准,该标准定义了以太网的帧格式的扩展,以支持虚拟局域网。

虚拟局域网协议允许在以太网的帧格式中插入一个4字节的标识符,称为 VLAN 标记 (tag),用来指明该帧属于哪一个虚拟局域网。插入VLAN标记得出的帧称为 802.1Q 帧或带标记的以太网帧。

image-20210413175642834

传送过程图示

image-20210413175721413

高速以太网

100BASE-T 以太网

速率达到或超过 100 Mbit/s 的以太网称为高速以太网。

100BASE-T 在双绞线上传送 100 Mbit/s 基带信号的星形拓扑以太网,仍使用 IEEE 802.3 的 CSMA/CD 协议。100BASE-T 以太网又称为快速以太网 (Fast Ethernet)。1995 年IEEE已把 100BASE-T 的快速以太网定为正式标准,其代号为 IEEE 802.3u。

特点

  • 可在全双工方式下工作而无冲突发生。在全双工方式下工作时,不使用 CSMA/CD 协议
  • MAC 帧格式仍然是 802.3 标准规定的。
  • 保持最短帧长不变,但将一个网段的最大电缆长度减小到 100 米。
  • 帧间时间间隔从原来的 9.6μs 改为现在的 0.96μs 。

100 Mbit/s 以太网的三种不同的物理层标准

  • 100BASE-TX
    1. 使用 2 对 UTP 5 类线 或 屏蔽双绞线 STP。
    2. 网段最大程度:100 米。
  • 100BASE-T4
    1. 使用 4 对 UTP 3 类线 或 5 类线。
    2. 网段最大程度:100 米。
  • 100BASE-FX
    1. 使用 2 对光纤。
    2. 网段最大程度:2000 米。

吉比特以太网

允许在 1 Gbit/s 下以全双工和半双工两种方式工作。使用 IEEE 802.3 协议规定的帧格式。在半双工方式下使用 CSMA/CD 协议,全双工方式不使用 CSMA/CD 协议。与 10BASE-T 和 100BASE-T 技术向后兼容。

吉比特以太网可用作现有网络的主干网,也可在高带宽(高速率)的应用场合中。

使用两种成熟的技术:一种来自现有的以太网,另一种则是美国国家标准协会 ANSI 制定的光纤通道 FC (Fiber Channel)。

名称 媒体 网段最大长度 特点
1000BASE-SX 光缆 550 m 多模光纤(50 和 62.5 mm)
1000BASE-LX 光缆 5000 m 单模光纤(10 mm)多模光纤(50 和 62.5 mm)
1000BASE-CX 铜缆 25 m 使用 2 对屏蔽双绞线电缆 STP
1000BASE-T 铜缆 100 m 使用 4 对 UTP 5 类线

半双工方式工作的吉比特以太网

吉比特以太网工作在半双工方式时,就必须进行碰撞检测。为保持 64 字节最小帧长度,以及 100 米的网段的最大长度,吉比特以太网增加了两个功能:

  1. 载波延伸 (carrier extension)
  2. 分组突发 (packet bursting)

载波延伸

使最短帧长仍为 64 字节(这样可以保持兼容性),同时将争用时间增大为 512 字节

凡发送的 MAC 帧长不足 512 字节时,就用一些特殊字符填充在帧的后面,使MAC 帧的发送长度增大到 512 字节。接收端在收到以太网的 MAC 帧后,要将所填充的特殊字符删除后才向高层交付。

image-20210413195200135

分组突发

当很多短帧要发送时,第一个短帧要采用载波延伸方法进行填充,随后的一些短帧则可一个接一个地发送,只需留有必要的帧间最小间隔即可。这样就形成可一串分组的突发,直到达到 1500 字节或稍多一些为止。

image-20210413195224917

全双工方式工作的吉比特以太网

当吉比特以太网工作在全双工方式时(即通信双方可同时进行发送和接收数据),不使用载波延伸和分组突发。

10 吉比特以太网 (10GE) 和更快的以太网

10 吉比特以太网(10GE)并非把吉比特以太网的速率简单地提高到 10 倍,其主要特点有:

  1. 与 10 Mbit/s、100 Mbit/s 和 1 Gbit/s 以太网的帧格式完全相同。
  2. 保留了 802.3 标准规定的以太网最小和最大帧长,便于升级。
    不再使用铜线而只使用光纤作为传输媒体。
  3. 只工作在全双工方式,因此没有争用问题,也不使用 CSMA/CD 协议。

10GE 的物理层标准

名称 媒体 网段最大长度 特点
10GBASE-SR 光缆 300 m 多模光纤(0.85 mm)
10GBASE-LR 光缆 10 km 单模光纤(1.3 mm)
10GBASE-ER 光缆 40 km 单模光纤(1.5 mm)
10GBASE-CX4 铜缆 15 m 使用 4 对双芯同轴电缆 (twinax)
10GBASE-T 铜缆 100 m 使用 4 对 6A 类 UTP 双绞线

端到端的以太网传输

以太网的工作范围已经从局域网(校园网、企业网)扩大到城域网和广域网,从而实现了端到端的以太网传输

这种工作方式的好处有:

  1. 技术成熟;
  2. 互操作性很好;
  3. 在广域网中使用以太网时价格便宜;
  4. 采用统一的以太网帧格式,简化了操作和管理。

使用以太网进行宽带接入

IEEE 在 2001 年初成立了 802.3 EFM 工作组,专门研究高速以太网的宽带接入技术问题。

以太网宽带接入具有以下特点

  1. 可以提供双向的宽带通信。
  2. 可以根据用户对带宽的需求灵活地进行带宽升级。
  3. 可以实现端到端的以太网传输,中间不需要再进行帧格式的转换。这就提高了数据的传输效率且降低了传输的成本。
  4. 但是不支持用户身份鉴别

PPPoE

PPPoE (PPP over Ethernet) 的意思是“在以太网上运行 PPP”,它把 PPP 协议与以太网协议结合起来 —— 将 PPP 帧再封装到以太网中来传输。

现在的光纤宽带接入 FTTx 都要使用 PPPoE 的方式进行接入。在 PPPoE 弹出的窗口中键入在网络运营商购买的用户名和密码,就可以进行宽带上网了。

利用 ADSL 进行宽带上网时,从用户个人电脑到家中的 ADSL 调制解调器之间,也是使用 RJ-45 和 5 类线(即以太网使用的网线)进行连接的,并且也是使用 PPPoE 弹出的窗口进行拨号连接的。