第二章 数据通信理论基础教材.docx
《第二章 数据通信理论基础教材.docx》由会员分享,可在线阅读,更多相关《第二章 数据通信理论基础教材.docx(29页珍藏版)》请在冰豆网上搜索。
第二章数据通信理论基础教材
2数据通信理论基础
2.1数据通信
2.1.1数据的定义与表示形式
在数据通信中,数据是指以任何形式格式表示的信息,该格式需要由创建和使用数据的双方达成共识,即通信协议。
现在的数据信息形式有文本、数字、图像、音频和视频等多种形式。
文本、数字及图像一般采用位模式表示。
以图像为例,图像的每一个像素可用一个位模式表示,模式的大小和值取决于图像,就一幅仅由黑白点构成的图像而言,1位模式就足可以表示一个像素。
可以通过增加位模式的大小来包含更多的灰度范围,如可以用2位模式表示4个级别的灰度。
音频与上面几种有着本质的不同,它是连续的、非离散的。
视频既可以由一个连续实体产生,也可以由一组图像合成,当由图像合成时,这些图像的每一幅都是一个离散的实体,但组合起来就可以表示运动的意思。
2.1.2数据通信方式
串行通信和并行通信。
单工、半双工和全双工通信。
2.1.3通信系统的组成
通信系统是传递信息所需的一切技术设备的总合。
它一般由信息源和信息接收者,发送、接收设备,传输媒介几部分组成。
单向数字通信系统的结构如图2-1所示。
信息源和信息接收者信息源和信息接收者是信息的产生者和使用者。
在数字通信系统中传输的信息是数据,是数字化了的信息。
这些信息可能是原始数据,也可能是经计算机处理后的结果,还可能是某些指令或标志。
由于信息源产生信息的种类和速率不同,因而对传输系统的要求也各不相同。
发送设备发送设备的基本功能是将信息源和传输媒介匹配起来,即将信息源产生的消息信号经过编码,并变换为便于传送的信号形式,送往传输媒介。
对于数字通信系统来说,发送设备的编码常常又可分为信道编码与信源编码两部分。
信源编码是把连续消息变换为数字信号;而信道编码则是使数字信号与传输介质匹配,提高传输的可靠性或有效性。
变换方式是多种多样的,调制是最常见的变换方式之一。
发送设备还要包括为达到某些特殊要求所进行的各种处理,如多路复用、保密处理、纠错编码处理等。
传输介质传输介质是指发送设备到接收设备之间信号传递所经媒介。
它可以是无线的,也可以是有线的。
有线和无线均有多种传输媒介,如电磁波、红外线为无线传输介质,各种电缆、光缆、双绞线等为有线传输介质。
介质在传输过程中必然会引入某些干扰,如热噪声、脉冲干扰、衰减等。
媒介的固有特性和干扰特性直接关系到变换方式的选取。
接收设备接收设备的基本功能是完成发送设备的反变换,即进行解调、译码、解密等。
它的任务是从带有干扰的信号中正确恢复出原始信息来,对于多路复用信号,还包括解除多路复用,实现正确分路。
以上所述是单向通信系统,但在大多数场合下,信源兼为收信者,通信的双方需要随时交流信息,因此要求双向通信。
这时,通信双方都要有发送设备和接收设备。
如果两个方向有各自的传输媒介,则双方都可独立进行发送和接收;但若共用一个传输媒介,则必须用频率或时间分割的办法来共享。
通信系统除了完成信息传递外,还必须进行信息的交换。
传输系统和交换系统共同组成一个完整的通信系统,直至构成复杂的通信网络。
2.2数据的同步与异步传输
要求长距离传输数字数据的场合,都采用串行传输方式,串行传输包含两种传输方式:
同步传输与异步传输。
这两种方式都必须解决同步问题。
2.2.1同步传输
同步传输是一种以报文和分组为单位进行传输的方式。
由于报文可包含许多字符,因此可大大减少用于同步的信息量,提高传输速率。
目前在计算机网络中大多采用此种传输方式。
它要求通信双方以相同的速率进行,而且要准确协调。
它通过共享单个时钟或定时脉冲源以保证发送方和接收方准确同步。
同步传输的特点是允许连续发送一个字符序列,每个字符数据位数相同,没有起始位和停止位,效率高。
传输数字信号时,在接收端必须有与数据位脉冲具有相同频率的时钟脉冲来逐位读入数据。
为了正确读入数据,时钟脉冲的上跳沿必须作用在数据位脉冲稳定之后,通常是数据位脉冲的中间时刻。
即对时钟脉冲的相位还有要求。
这种在接收端使数据位与时钟脉冲在频率和相位上保持一致的特性被称为同步,实现这种同步的技术被称为同步方式。
位同步方式在发送端对每位数据位都需附加同步信息,是同步传输中采用的重要的同步方式之一。
在数据同步传输发送端可以附加与发送数据位同步的时钟脉冲,如图2-2所示,在数据同步传输接收端使用这个时钟脉冲来读取数据。
这样就不必再附加冗余的同步信息,从而提高了数据的传输效率。
但是,要附加一条专用的传输时钟脉冲的通信线路。
采用曼彻斯特编码技术可以省去这条通信线路,且能达到同步传输目的,留着后面介绍。
2.2.2异步传输
异步方式又称起止同步方式(字符同步方式),这是在计算机通信中常用的同步方式。
异步方式中,并不要求收发双方在传送代码的每一比特时都同步。
通信收发方可采用各自的时钟源,通信双方都遵循异步通信协议。
异步通信以一个字符作为数据传输单位,发送方传送字符的时间间隔不确定。
每个字符传输都以起始位开始,以停止位结束。
通信双方所约定的通信字符的数据位数、奇偶校验方法、停止位数必须相同,异步通信字符间的发送时间是异步的,即后一个字符与前一个字符的发送时间无关,字符之间的时间间隔是任意的,因此成为异步传输方式。
异步通信传输效率比同步通信方式低,但成本也低。
由于异步通信传输的数据以字符为单位,为了进行字符同步,每个字符的第一位前加1位起始位(逻辑0),字符的最后一位后加上1、1.5或2位的终止位(逻辑1)。
异步通信传输简单,但每个字符有2-3位的额外开销。
如图2-3所示。
在收发两端都有各自的时钟源,但它们的频率必须是一致的。
在接收端,起始位的下降沿触发接收端的内部时钟。
经过半个周期后再检测输入电平,如仍为低电平即是一个有效的起始位,否则是干扰信号。
发送端空闲时输出一直保持高电平。
起始位的下跳沿就是同步参考信号(计时器)。
虽然在收发端不是同一时钟源,会有频率误差,但对每个字符都要重新同步一次,字符之间的时钟频率误差不会积累,接收一个字符期间不会发生数据位与时钟失步。
在字符同步方式中,通信双方必须约定一致的时钟频率、传输字节的长度(位数),校验方式、停止位长度等,即双方要对通信接口进行相同的参数初始化,才能保证异步通信的正确进行。
2.3数据的编码与传输方式
2.3.1数据的编码
计算机网络系统的通信任务是传送数据或数据化的信息。
这些数据通常以离散的二进制0,1序列的方式表示。
数据编码是指通信系统中以何种物理信号的形式来表达数据。
分别用模拟信号的不同幅度、不同频率、不同相位来表达数据的0,1状态,称为模拟数据编码。
用高低电平的矩形脉冲信号来表达数据的0,1状态的,称为数字数据编码。
模拟数据和数字数据都可以用模拟信号和数字信号的形式在通信信道上传输。
除了模拟数据以模拟信号传输外,其他通信方式都需要对数据进行编码。
一、不归零码(NRZ)
通常数字信号用两种不同的电压电平的脉冲序列来表示,如图2-4所示。
如是正逻辑表达的话,高电平为1,低电平为0。
这种编码方式成为不归零码(NRZ)。
NRZ数字信号传输的最大问题是没有同步信号,在接收方不能区分每个数据位,也就不能正确接收数据,如增加同步时钟脉冲,就要增加额外的传输线。
另外,脉冲序列含有直流分量,特别是有连续多个1或0信号时,直流分量会累积。
这样就不可能采用变压器耦合方式来隔离通信设备和通信线路,以保护通信设备的安全。
因此,在同步数据传输时,通常不采用NRZ码。
二、曼彻斯特编码
目前,在传输数字信号时常采用曼彻斯特编码和差分曼彻斯特编码,它具有内在的时钟信息,因而能使网络上的每一个系统保持同步,如图2-5所示。
这两种编码的每位数据位的中心都有一个跳变,可以起到传递位同步信号的作用。
在曼彻斯特编码中,还以这个跳变的方向来判断这位数据是1还是0。
通常,从高电平跳到低电平为0,从低电平跳到高电平为1。
(即每位的后半部分传递的是比特值本身。
有的书则相反。
)
在差分曼彻斯特编码中,以每位数据位的开始是否有跳变来表示这位数据是1还是0。
无跳变表示1,有跳变表示0。
也可用当前数据位的前半周期的电平与前一数据位的后半周期的电平进行比较,如一致为1,反相为0。
这两种编码都带有数据位的同步信息,又称为自同步编码。
同时,这两种编码的每位数据位都有跳变,整个脉冲序列的直流分量比较均衡,可以采用变压器耦合方式进行电路隔离。
采用曼彻斯特编码和差分曼彻斯特编码在数据波形上携带了时钟信息,即在每个数据位中间都有一个电平跳变。
在接收端利用这个跳变来产生接收同步时钟脉冲。
其信息传输过程如图所示。
由于数据和时钟同时在一条线路上传输,不会出现失步情况,可以用较高的传输速率来传输数据,适用于同步传输方式。
2.3.2数据的传输
局域网中使用的传输方式有基带传输和频带传输两种方式。
基带传输用于数字信号传输,频带传输用于模拟信号的传输。
一、基带传输
使用数字信号传输的局域网定义为基带局域网。
数字信号通常采用曼彻斯特编码,媒体的整个带宽用于单信道的信号传输,不采用频分多路复用技术。
基带系统只能延伸数公里的距离,这是由于信号的衰减会引起脉冲减弱和模糊,以致无法实现更远距离的通信。
基带传输是双向的,媒体上任意一点加入的信号沿两个方向传输到两端的端接器(即终端接收阻抗器,终端电阻),并在那里被吸收,如图2-6所示。
总线局域网常采用50Ω的基带同轴电缆或120Ω的非屏蔽双绞线。
对于数字信号来说,50Ω电缆受到来自接头插入容抗的反射不强,且对低频电磁噪声有较好的抗干扰性。
最简单的基带同轴电缆局域网由一段无分支的同轴电缆构成,两端接有防反射的端接器,推荐的最大长度为500m。
站点通过接头接入主电缆,任何两接头间的距离为2.5m的整倍数,这是为了保证来自相邻接头的反射在相位上不叠加。
推荐最多接头数目为100个。
每个接头包括一个收发器,其中包含发送和接收用的电子线路。
为了延伸网络的长度,可以采用中继器。
中继器由两个收发器组合而成,连到不同的两段同轴电缆上。
中继器在两段电缆间向两个方向传送数字信号,在信号通过时将信号放大和复原。
由于中继器不做缓冲存储操作,所以并没有将两段电缆隔开,因此如果不同段上的两个站同时发送,它们的分组将互相干扰(冲突)。
IEEE802标准中,在任何两个站之间的路径中最多只允许有4个中继器,这就将有效的电缆长度延伸到2.5km。
双绞线基带局域网是一种新兴的广泛使用的网络形式。
双绞线安装容易,但往往限制在1km以内,数据速率为1~100Mb/s。
二、频带传输
频带传输是利用模拟通信信道进行数据通信的方式。
计算机的通信是要求传送数字信号,而在进行远程数据通信时,通信线路往往是借用现有的公用电话网。
但是,电话网是为传输300~3400Hz之间的音频信号而设计的,这对二进制数据的传输不适合。
由于电话线只能传输模拟信号,因此必须对数据进行转换。
数字信号必须调制到模拟信号之上进行传输,然后经过解调还原成数字信号。
这一过程为调制与解调,其设备为调制解调器(modem)。
在模拟传输中,通常采用信道允许的频带范围内某一频率的正(余)弦信号作为载波信号,调制时根据数据的不同改变信号的特征。
正弦波有3种特征,即振幅、频率和相位,改变其中任何一种特征都会产生一种不同的正弦波。
如果原始波形表示二进制1,则变化后的波形可表示二进制0。
所以改变模拟信号的某个特征就可以表示数字数据。
常见的调制方法有:
幅移键控(ASK)、频移键控(FSK)和相移键控(PSK)。
如图2-7所示。
下面以常见的FSK传输方式说明调制解调器的工作原理。
FSK把0和1的两种数字信号分别调制成不同频率的两个音频信号,原理图2-8所示。
两个不同频率的模拟信号f1(1270Hz)和f2(1070Hz),分别经过电子开关S1和S2送到运算放大器的输入端相加,电子开关的通断由外部信号控制,高电平时电子开关接通,低电平时断开。
利用被传输数字信号控制电子开关。
当数字信号为1时,S1接通,送出一串频率为f1的模拟信号,f2同理。
经运算放大器相加后调制成两种频率的音频信号。
解调过程与调制过程相反,如图2-9所示。
信道上传来的信号由两种频率组成,通过上下两个带通滤波器,两种信号实现分离,再各自经过对应的检波器后,经过合成器复原出原来的数据信号。
调制解调器具有发送和接受能力,这可以通过上下两个频带解决,Bell103标准规定了FSK调制解调器上下频带的编码规则:
上频带:
2225Hz表示数据1;2025Hz表示数据0。
下频带:
1270Hz表示数据1;1070Hz表示数据0。
标准中规定:
主动发起通信的一方使用下频带发送,上频带接收;接收端使用上频带发送,下频带接收。
2.3.3多路复用技术
多路复用技术是将来自不同信息源的各路信息按某种方式合并为一路,通过同一信道传送给接收器端,接收端再按相应方式分离出各路信号送给不同的用户。
多路复用的方式有频分复用、时分复用、码分复用、波分复用和时间压缩复用等。
在复用系统中要使用两个主要器件:
一是复接器,它的功能是把几路信号按复用的原理合成为一个合路信号。
另一个是分接器,它的功能与复接器相反,是把合路信号还原为几路支路信号。
把复接器和分接器装在一起成为数字复接设备。
一、频分多路复用
频分多路复用(FDM)是一种模拟技术,可以应用在链路带宽高于传输信号组合带宽的情况。
按照频率区分信号的方法把传输频带分成若干个较窄的频带,每个窄频带构成一个子通道,每个子通道独立地传输一路信息。
如图2-10所示。
输入n路具有相同带宽W的数据,线路上的频带是每个数据源带宽的n倍以上,即线路的频带宽WL>nW,将线路的频带划分成n个带宽大于W且互不重叠的窄频带,分别作为n路输入数据的子信道。
在接收端的分离设备则利用已调信号的不同频段将各路信号分离出来,恢复为n路输出数据。
二、时分多路复用
时分多路复用(TDM)是将物理信道按时间分成时间片,轮流分配给多个信源来使用公共线路。
只要各路数据传输中时间上能区分开(不重叠),那么一个信道就可以传输多路数据。
为实现时分多路复用,可将各路数据分段压缩在一系列等宽的时隙内,通过复合电路将它们按序复合在一起发送到通信线路上传输。
在目的端通过采用其定时脉冲分别对准各路时隙序列的定时扫描电路,即可将各路数据分离出来。
2.4信息交换技术
网络中任意两个节点间并不一定存在一条通信媒体。
这些节点间的通信需通过中间节点的接收和转发,才能把数据从源节点发送到目的节点。
因此,复杂网络中两站之间交换信息存在路径选择问题,即如何控制信息传输,以提高线路的利用率。
通常使用的信息交换技术有线路交换与存储转发交换。
2.4.1线路交换
线路交换是指通过网络中的节点在两个站之间建立一条专用的物理线路进行数据传送,传送结束再“拆除”线路。
线路交换方式的通信过程分三个阶段:
线路建立阶段,数据传输阶段,线路释放阶段。
由于建立了一条专用线路,所以报文传送的实时性好,各节点延时小(传输延迟只有线路传输造成的延迟,对于一次连接,其传输延迟是固定的)。
但是,一旦两站连接起来,即使没有数据传送,其它的站也不能使用线路上的节点,因而线路的利用率低,对突发性通信不适应。
为了提高利用率,可采用存储转发交换方式。
2.4.2存储转发交换
存储转发交换方式不需要在两个站之间建立一条专用线路。
发送的数据与目的地址、源地址、控制信息按一定的格式组成一个数据单元,即报文或报文分组,利用通信站点的通信控制处理器完成数据单元的接收、差错校验、存储、路选和转发功能。
存储转发交换方式分为两类:
报文交换与报文分组交换。
其结构如图2-11所示。
报文交换方式在发送数据时,可以不管发送数据的长度是多少,都把它作为一个逻辑单元,在发送的数据上加上目的地址、源地址与控制信息按一定的格式打包后组成一个报文。
而报文分组方式是限定数据的最大长度,在发送站将一个长报文分成多个报文分组,在接收站再将多个报文分组按顺序重新组织成一个新报文。
由于报文分组长度较短,传输差错检错容易,出错重发花费时间较少,有利于提高存储转发节点存储空间利用率和传输效率,因此成为当今公用数据交换网中主要的交换技术。
报文分组交换技术在实际应用中又分为两类:
数据报方式与虚电路方式。
一、数据报方式
数据报方式的数据交换过程如图2-12所示。
源主机HA将报文分成报文分组P1,P2,…,依次发送到与其直接连接的通信控制处理器A(即节点A)上。
节点A每收到一个报文分组均要进行差错检测,以保证HA与节点A的数据传输正确性;节点A接收到报文分组P1,P2,…后,要为每个报文分组进入通信网络的下一个节点启动路选算法。
由于网络通信状态是不断变化的,报文分组P1的下一个节点可能选择C,而报文分组P2的下一个节点可能选择为D,因此同一报文的不同分组通过子网的路径可能是不相同的。
节点A向节点C发送报文分组P1时,节点C要对P1传输的正确性进行检测。
如果传输正确,节点C向节点A发送正确传输的确认信息;节点A接收字节C的确认信息后,确认P1已经传输,则废弃P1的副本。
其他节点的工作工程与节点C的工作过程相同。
这样报文分组P1通过通信子网多个节点存储转发,最终正确到达目的节点B。
(面向无连接的网络服务)
二、虚电路方式
虚电路方式试图将数据报方式与线路交换方式结合起来,发挥两种方法的优点,达到最佳数据交换效果。
工作过程如图2-13所示。
在数据报工作方式中,报文分组发送之前,发送方与接收方之间不需要预先建立连接。
虚电路方式在报文分组发送之前,需要在发送方和接收方建立一条逻辑连接的虚电路。
在这一点上,虚电路方式与线路交换方式相同,整个通信过程分为三个阶段:
虚电路建立阶段、数据传输阶段和虚电路拆除阶段。
在虚电路建立阶段,节点A启动路选算法,选择下一个节点,例如选择了D节点,向节点D发送“连接请求分组”。
同样节点D也要启动路选算法选择下一个节点。
依此类推,“连接请求分组”经过A-D-C-B,传送到目的节点B。
目的节点B向源节点A发送“连接接收”,至此虚电路建立,相当于建立了一条逻辑线路。
为了提供虚电路服务,每个节点都有一张虚电路转换表,以记录下一个节点(用HA---HB、HA---HG说明D节点虚电路转换表)。
在数据传输阶段,虚电路方式利用已建立的虚电路逐站以存储转发方式顺序传送报文分组。
传输结束后进入虚电路拆除阶段。
虚电路是一条逻辑通路,并不是实际的物理通路,它为分组交换机设备之间的连接提供一种链路的通信关系,发送站有数据传输时,可任意时刻发送,如果没有数据发送,则这种通信关系可以被保持,但通信线路可用作其它服务。
(面向连接的网络服务)
不同的交换方式适用于不同的应用场合。
线路交换适合于高负荷的持续通信要求,尤其是会话式通信与语音、图像通信,不适合于突发性通信;报文交换适合于长报文、无实时要求的通信;数据报方式适合于灵活的突发性短报文传输,不适合会话式和有实时性要求的通信;虚电路方式既适合定时、定对象、长报文通信,也适合会话式通信以及语音、动态图像通信要求。
一般在通信网络中即提供数据报服务也同时提供虚电路服务。
2.5数据检错方法
数据信息位在向信道发送之前,先按照某种关系附加上一定的冗余位,构成一个特定码字后再发送,这个过程称为差错控制编码过程。
通信接收端收到该特定码字后,检查信息位和附加的冗余位之间的关系,以检查传输过程中是否有差错发生,这个过程称为检验过程。
差错控制编码可分为检错码和纠错码。
检错码:
能自动发现差错的编码。
纠错码:
不仅能发现差错,而且能自动纠正差错的编码。
在自动请求重发(ARQ)方式中,当接收端发现差错时,就设法通知发送端重发,直到接收到正确的码字为止,自动请求重发方式只使用检错码。
在前向纠错(FEC)方式中,通信接收端不但能发现差错,而且能确定二进制码元发生错误的位置,从而加以纠正。
前向纠错方式必须使用纠错码,见下一节。
差错检测技术的核心是校验编码,常用的校验编码有奇偶校验编码、循环冗余校验编码等。
2.5.1奇偶校验编码
奇偶校验编码是对要发送的整个格式报文(一个字节或一帧数据)中的数字为“1”的码元个数进行统计,根据统计结果,按以下规则生成奇偶校验位:
当“1”码元数为奇数:
采用偶校验,校验位为“1”;
采用奇校验,校验位为“0”;
当“1”码元数为偶数:
采用偶校验,校验位为“0”;
采用奇校验,校验位为“1”。
即在采用奇校验时,报文加上校验位后应保证“1”码元个数为奇数;而在采用偶校验时,报文加上校验位后应保证“1”码元个数为偶数。
例如:
信息位1000110,奇校验时冗余位0,编码为10001100
偶校验时冗余位1,编码为10001101
奇偶校验码是一种最常见的检错码,它分为垂直奇偶校验、水平奇偶校验及水平垂直奇偶校验。
奇偶校验方法简单,但检错能力差,一般只用于通信要求较低的环境。
2.5.2循环冗余校验编码
一、循环冗余码的工作方法
循环冗余码(CRC)的工作方法是在数据发送端产生一个循环冗余码,附加在信息位后面一起发送到接收端。
接收端收到信息后,按发送端形成循环冗余码的同样的算法进行校验,若有错,需重发。
循环冗余码CRC属检错码,是多项式码。
用多项式码作为检验码时,发送方和接收方必须具有相同的校验码生成多项式
,其最高、最低项系数必须为1。
CRC编码过程是将要发送的二进制序列看做是一个多项式
的系数,加上监督位之后,除以校验码生成多项式
,然后将余数多项式
加到数据多项式之后发送到接收端。
CRC译码过程是接收端用同一校验码生成多项式除以接收到的CRC编码,若余数为零,则传输正确。
称为信息代码多项式,如二进制数字序列10101111可表示为:
式中的xi表示代码的位置或某个二进制数位的位置,xi前面的系数表示码的值。
在模2多项式代数运算中定义的运算规则如下:
由于加减法没有进位和借位(相当于异或运算),因此对于模2运算来说,代码多项式的加法和减法运算所得的结果相同,所以在做代码多项式的减法时,可用加法进行。
代码多项式的除法可按长除法进行计算。
CRC校验的工作过程如下。
(1)发送方将发送数据多项式
乘以
,其中r为生成多项式的最高幂值。
对应多项式为
,其意义是将发送数据比特序列左移r位,用来存入余数。
(2)将
除以生成多项式
,得余数多项式
。
(3)将
与余数多项式
对应位异或,得编码信息
并发送给对方。
(4)接收方收到编码信息后,用同一个生成多项式
除编码信息,若余数为零,则表示接收到正确的编码信息,否则有错。
(5)把收到的正确编码信息
去掉尾部r位,即得数据信息
。
例数据信息
1101011011
生成式
10011
11010110110000
÷
得余数1110
待发送的信息编码
11010110111110
接收方用
除以
得余数0
二、循环冗余码的产生与码字正确性检验举例
例:
已知信息码为110011;生成码为11001,求循环冗余码(CRC码)和码字。
解:
由于r=4,信息码左移4位,为1100110000,
按模2算法除以生成码,得余数为1001,即冗余码为1001,码字为1100111001。
例:
已知接收码字为1100111001,生成码为11001,判断码字的正确性,若正确,则指出冗余码和信息码。
解:
用码字除以生成码,余数为0,所以码字正确。
因r=4,所以冗余码是1001,信息码是110011。
CRC的检错能力取决于生成多项式的值,不是任何一个多项式都适合做生成多项式的。
CRC生成多项式由协议规定,列入国际标准的生成多项式有多种,如:
CRC-12
CRC-16
CRC-CCITT
CRC-16、CRC-C