电视原理论文.docx
《电视原理论文.docx》由会员分享,可在线阅读,更多相关《电视原理论文.docx(15页珍藏版)》请在冰豆网上搜索。
电视原理论文
数字电视中信号的处理
摘要:
数字电视的信号从发送、传输到接收的全过程都为数字化。
本文简单的介绍了A/D转化,数据压缩,MPGE—2的视频音频的压缩标准。
以及信号调制的过程。
关键字:
A/D转化数据压缩MPGE—2信号调制
数字电视是指电视的图像和音频用数字化信号发送。
所以准确定义的数字电视除了指我们平时所说的数字电视接收机外,还包含了从发送、传输到接收的全过程。
由电视台送出的图像及声音信号,经数字压缩和数字调制后,形成数字电视信号,经过无线介质或有线介质传送到数字电视接收机,然后通过数字解调和数字视音频解码处理还原出图像及伴音。
一、将模拟信号转换为数字信号
将连续的模拟信号转变成数字信号是数字电视信号采集的必要步骤。
在实际工作中,信号的取样是通过A/D转换芯片来完成的。
通过A/D转换,将模拟信号x(t)变成数字信号x(nTs),电视信号的A/D转换一般采用脉码调制方式。
为了保证数字化后的信号数据不丧失原信号的特性,采样频率应大于或至少等于信号截止频率的2倍。
这就是著名的奈奎斯特(Nyquist)采样定理对于二维图像信号,必须保证水平采样频率和垂直采样频率应分别大于图像在水平和在垂直方向上最高频率的2倍。
而对于音频信号,采用的频率应大于音频信号的最大频率的2倍。
一般质量音频信号的最高频率被限制在15kHz,所以目前有四种不同的采样频率:
48kHz;44.1kHz;44.056kHz;32kHz。
采样结束后对采样信号进行量化使得幅度连续的抽样值进一步在幅度上离散化。
便于利用有限长的数码来表示每个抽样点的幅度。
量化所产生的误差会影响信号的质量,分析时,一般将它等效于随机杂波,称为量化噪波。
当量化的位数n越大,量化的信噪比就越大,再生的图片质量就越高。
对于音频信号的量化过程中所产生的噪声,为了使量化噪声转变为与输入不相关的白噪声,就要在输入的音频信号上加上一称为高频脉动信号的噪声再进行量化。
接下来对样点幅度的量化值进行编码,将其转变为成二进制的数码。
经抽样,量化,编码所得到的数字信号极为PCM信号。
(一)图像编码
数字电视中对于图像的处理是一个比较复杂的过程。
数字电视是在模拟电视的基础上发展起来的,数字电视设备要和模拟电视设备长期共存,因此,在选择电视信号数字化参数时要考虑到数字电视设备的兼容性问题,使现存的模拟电视制式和数字电视能有最大程度的共同性。
电视信号的数字化处理有数字复合编码和数字分量编码两种方式。
数字复合编码是将复合彩色全电视信号直接进行数字化。
复合编码的优点是码率低些,设备较简单,适用于在模拟系统中插入单个数字设备的情况。
采用复合编码时由抽样频率和副载频间的差拍造成的干扰将影响图像的质量。
它的缺点是由于数字电视的抽样频率必须与彩色副载频保持一定的关系,而且各种制式的副载频各不相同,难以统一。
分量编码是将三基色信号R、G、B分量或亮度和色差信号Y、(B-Y)、(R-Y)分别编码形成数字化信号分量编码的优点是编码与制式无关,只要抽样频率与行频有一定的关系,便于制式转换和统一。
由于Y、(R-Y)、(B-Y)分别编码,可采用时分复用方式,避免亮色互串,可获得高质量的图像。
在分量编码中,亮度信号用较高的码率传送,两个色差信号的码率可低一些,但总的码率比较高,设备价格相应较贵。
图像的采样结构是指采样点在空间和时间上的相对位置。
采样结构有正交结构和行交叉结构等几种,在数字电视图像采样中一般使用正交结构,以有利于帧内和帧间信号处理。
为保证采样结构为正交,要求行周期必须是采样周期的整数倍。
图像亮度信号的采样应满足采样定理的要求,取样频率应大于视频带宽的2倍。
为保证采样结构正交,采样频率应是行频的整数倍。
为方便节目交流,亮度信号采样频率应兼顾NTSC制和PAL制,即应是这两种制式行频的最小公倍数的整数倍。
为降低码率,采样频率的选择应尽量小。
根据大面积着色原理,色度信号的带宽可以比亮度信号窄,同时考虑正交结构的要求,在数字电视中经常使用以下几种亮色采样格式:
4:
2:
2格式;4:
4:
4格式;4:
2:
0格式;4:
1:
1格式。
在4:
2:
2格式中,色差信号Cr和Cb的采样频率均为亮度信号采样频率的一半,即:
fCr=fCb=(1/2)fy=6.75MHz。
也就是亮度采样频率和两个色差信号的采样频率之比为:
fy:
fCr:
fCb=4:
2:
2
色差信号在水平方向上的采样点数为亮度信号的一半,在垂直方向上的采样点数与亮度信号相同。
这种格式主要用于标准清晰度数字电视(SDTV)演播室中。
在4:
4:
4格式中,色差信号Cr和Cb的采样频率与亮度信号采样频率相同,即:
fCr=fCb=fy=13.5MHz。
也就是亮度采样频率和两个色差信号的采样频率之比为:
fy:
fCr:
fCb=4:
4:
4。
这种格式主要用于要求高质量的信号源的情况下,比如科学研究等。
而4:
2:
0格式侧重于传输链末端分配应用,MPEG-2中使用的就是这种方式。
4:
1:
1则应用于新闻、体育等对质量要求不高的记录环境。
(二)音频编码
香农定理指出:
如果信号的平均信息量小于所用传输通路的传输容量,则存在着正确的编码方式。
所以要有效的利用传输通路,必须对知道传输通道的传输容量,以及信号的信息量,找出最佳的编码方式。
1、利用冗余度节约传输通路
(1)预测编码
它是从过去的采样值预测现在的才样值,并将真正的取样值与预测值之差进行编码传输的编码。
(2)熵编码
在数字化的信号中,小电平比大电平出现的机会要多。
因此可以像莫尔斯电报码一样,对于出现概率较大的电平,采用短码,而概率较小的电平采用长码,从而进一步节约比特率。
2、利用数据压缩技术节约传输容量
(1)瞬时压扩与准瞬时压扩
利用人耳的听觉特性,在输入时将较宽的幅度范围进行压缩,而在输出的时候再进行扩张。
压扩操作可以在A/D转换或者数字阶段进行。
(2)自适应PCM
是一种根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。
这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以使音节自适应,即量化阶的大小在较长时间周期里发生变化。
(3)自差分PCM
它结合了ADM的差分信号与PCM的二进制码的方法,是一种性能比较好的波形编码。
它的核心想法是:
①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值,②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。
二、数字信号的压缩
电视信号数字化后的数据量过大,使普通的存储器难以接受。
而且,数码率太高使数字电视信号频带过宽,频道利用率太低,甚至无法容纳整个信号的传输。
分量编码:
4:
2:
2标准:
R=165.9Mb/s频带宽度B≈83MHz;
4:
4:
4标准:
R=278.7Mb/s频带宽度B≈140MHz;
4次群的R为139.264Mb/s,可传话路1920路。
1920路电话传不了一套4:
2:
2的数字电视节目;用11套模拟电视节目换一套数字电视节目。
号频带太宽,频带利用率低,频率资源严重浪费。
同时对电路要求高,设计复杂,维修困难,设备造价高。
所以对数字信号进行压缩显得很有必要。
由于图像本身存在大量的冗余:
空间相关冗余时间相关冗余;符号相关冗余;结构相关冗余;知识相关冗余。
以及人类的视觉冗余,所以对于图像信号的压缩时可行的。
压缩的途径及方法:
行、场逆程不传送,在接收端重新形成;亚奈奎斯特取样法,使得采样频率fs<2fm,使混叠分量与亮度谱线交错;采用高效率的编码――信源编码,去除电视信号中的冗余。
(一)图像压缩
1、预测编码
利用某种数学模式对以前已知的相关数据进行运算,得出一个与当前传送样值相接近的预测值,进而把当前要传送的值减去预测值,得到一个误差值――预测误差,将这个误差值编码后传送出去。
当前样值-预测值=预测误差
预测编码去除了电视信号中空间、时间上的冗余。
给出了良好的概率分布,为后面的压缩编码创造了条件。
一维预测:
参考样值仅与xN当前样值处于同一扫描行内的预测编码;
二维预测:
参考样值除了本行之外还和前一行或前几行的样值有关;
三维预测:
参考样值除了本帧之外还和前一帧或前几帧图像的样值有关。
由于一、二维预测都是在同一帧内进行预测,所以也称为帧内预测编码;三维预测与前面的帧有关,所以也称为帧间预测编码。
2、变换编码
变换编码中经常使用的是离散余弦变换——DCT变换。
DCT变换是把空间域上的信号变换到频率域上,使能量在空间域上分散分布的原信号变换后能量在频率域上相对集中到某些少数区域内,即将空间域上的信号样值变换成频率域上的系数,经变换后的系数按频率由低到高分布。
DCT变换的处理步骤:
⑴将一幅图象分成若干像块,每个像块的大小为8×8个像素。
⑵对每一块像块进行DCT变换。
⑶对变换后的系数进行量化。
⑷进行之字形扫描(读出)和零游程编码
像块样值数据f(x,y)为8×8的矩阵,经DCT后的频域系数F(u,v)也为8×8的矩阵。
此矩阵的左上角系数F00相当于像块中64个样值的平均直流成分,其余的63个F(u,v)均表示64个样值中所含交流成分的系数。
经过变换后,较大的系数集中在直流分量及附近的低频区域,即信号能量主要集中在直流及低频区域的少数变换系数上,高频区域的系数多为0或很小。
3、统计编码(熵编码)
统计编码是基于信号统计特性的编码技术。
它的基本原理是按信源符号出现概率的不同分配以不同长度的码字(bit数),概率大的分配以短的码字,概率小的分配以长的码字。
这样使最终的平均码长很小,总的数码率大大降低。
经常使用的是霍夫曼编码。
基本的步骤如下:
①将每个符号按其概率由大到小顺序排列起来。
②将最小的两个概率相加,并对其中较大的概率用“1”表示,较小的概率用“0”表示。
反之也可,但赋值方式应保持一致。
③把求出的和值作为一个新的概率值再按①重新排列。
④按照这样的步骤重复进行,直到概率加到1。
⑤分配码字。
由概率为1处开始沿各点参加运算的分支线从后向前(从右向左)逐一写出“0”、“1”的代号(从高位到低位写)直到各符号为止。
得到的代码就是各信源符号的码字。
反之也可,从符号到汇合点p=1(从左到右),但代码的写出是从低位到高位。
(二)音频压缩
声音信号客观统计规律。
人耳听觉的生理、心理学因素根据声学理论,人耳存在着一个听觉的阈值,当某个频率的声音的强度(声强)小于某个特定的数值之后,人耳就听不见了,即当声音弱到人的耳朵刚刚可以听见时,我们称此时的声音强度为“听阈”。
在编码时,可以根据人耳的特性进行编码,减少冗余。
可将时间上彼此相继的取样值归并成块;由掩蔽效应,人耳听不到的不传;对于人耳不能分辨方向的频率接近的高频音,不必再分声道,将多声道的高频音耦合到一个公共通道;采用子频带编码,由每个子频带中的最小同听阈来确定各子频带取样值的必要的量化。
声音压缩主要有两种编码方法:
1、MUSICAM编码
MUSICAM----掩蔽型自适应通用子频带集成编码与复用。
这种编码的方法属于子频带编码,它是用滤波器组将宽频带的声音信号的频谱分割为宽度均为750Hz的32个子频带。
每个子带的量化和比特分配是利用人耳听觉的心理声学模型和音频信号统计特性的内在联系确定,并清除音频信号中的冗余和不相干部分,来实现有效的数据压缩。
⏹Layer1——简单版本。
在CD质量下,比特率为384Kb/s,压缩比为1:
4。
主要用于数字盒式录音磁带、VCD。
⏹Layer2——标准版本,编码器的复杂度属中等。
CD质量下,比特率为192Kb/s左右,压缩比为1:
8。
在数字演播室、DAB、DVB、电缆和卫星广播ADR、计算机多媒体等数字节目的制作、交换、存储、传送中得到广泛应用。
⏹Layer3——复杂版本。
它是MUSICAM和ASPEC(自适应(声频)频谱感知熵编码)的混合编码。
声音质量最佳。
在CD质量下,使用的比特率为128Kb/s,压缩比为1:
12。
主要用于通信、尤其适用于ISDN(综合业务数据网)上传送广播节目、应用于Internet网的声音点播、MP3光盘存储等。
2、杜比AC-3编码
AC-3是杜比实验室开发的数字音频编码技术,它提供5.1环绕立体声。
由于AC-3系统编码灵活,在消费电子领域,目前大多数的电影制作都使用了该技术,美国等国家的数字电视系统也采用该技术作为音频编码标准。
杜比AC-3也是一种感知型编码方式,它把整个音频频带根据人耳听觉特性分割成若干个较窄的频段,利用声心理学模型模拟人耳的听觉遮蔽效应,删除人耳所听不到或可忽略的部分,并采用窗函数处理、指数变换编码、自适应比特分配等压缩编码技术。
AC-3采用基于改良离散余弦变换(MDCT)的自适应变换编码(ATC)算法。
(三)MPGE—2标准
MPEG-2是一组用于视音频压缩编码及其数据流格式的国际标准。
它定义了编解码技术及数据流的传输协议;制定了MPEG-2解码器之间的共同标准(MPEG-2编码器之间尚无共同标准)。
压缩音、视频的主要任务是去掉信源的音、视频中的信息冗余,提高信源的有效性。
压缩完的音、视频数据比特流经复用系统处理复合成单路串行的比特流,复用系统把音频、视频、辅助数据的码流通过一个打包器打包(这是通俗的说法,其实是数据分组),然后再复合成单路。
1.MPEG-2的系统的定义
MPEG-2系统是将视频、音频及其它数据基本流组合成一个或多个适宜于存储或传输的数据流的规范,如图1所示。
由图1可见,符合ITU-R.601标准的、帧次序为I1B2B3P4B5B6P7B8B9I10数字视频数据和符合AES/EBU标准的数字音频数据分别通过图像编码和声音编码之后,生成次序为I1P4B2B3P7B5B6I10B8B9视频基本流(ES)和音频ES。
在视频ES中还要加入一个时间基准,即加入从视频信号中取出的27MHz时钟。
然后,再分别通过各自的数据包形成器,将相应的ES打包成打包基本流(PES)包,并由PES包
构成PES。
最后,节目复用器和传输复用器分别将视频PES和音频PES组合成相应的节目流(PS)包和传输流(TS)包,并由PS包构成PS和由TS包构成TS。
显然,不允许直接传输PES,只允许传输PS和TS;PES只是PS转换为TS或TS转换为PS的中间步骤或桥梁,是MPEG数据流互换的逻辑结构,本身不能参与交换和互操作。
由系统的定义,可知MPEG-2系统的任务。
2.系统的任务
MPEG-2的标准由表2所示的8个文件组成,MPEG-2系统是其关键部分。
MPEG以开放系统互联(OSI-OpenSystemInterconnection)为目标,争取全球标准化。
在详细规定视音频编码算法的基础上,为传输和交换编码数据流(比特流,码流,流)创造统一条件。
以利于接收端重建为指导,按照既定的参数给数据流以一定程度的“包装”。
因此,MPEG-2系统应完成的任务有:
●规定以包方式传输数据的协议;
●为收发两端数据流同步创造条件;
●确定将多个数据流合并和分离(即复用和解复用)的原则;
●提供一种进行加密数据传输的可能性。
3.系统的要点
根据数字通信信息量可以逐段传输的机理,将已编码数据流在时间上以一定重复周期结构分割成不能再细分的最小信息单元,这个最小信息单元就定义为数据包,几个小数据包(DataPacket)又可以打包成大数据包(DataPack)。
用数据包传输的优点是:
网络中信息可占用不同的连接线路和简单暂存;通过数据包交织将多个数据流组合(复用)成一个新的数据流;便于解码器按照相应顺序对数据包进行灵活地整理。
从而,数据包为数据流同步和复用奠定了基础。
因此,MPEG-2系统规范不仅采用了PS、TS和PES三种数据包,而且也涉及PS和TS两种可以互相转换的数据流。
显然,以数据包形式存储和传送数据流是MPEG-2系统的要点。
为此,MPEG-2系统规范定义了三种数据包及两种数据流:
将MPEG-2压缩编码的视频基本流(ES-ElementaryStream)数据分组为包长度可变的数据包,称为打包基本流(PES-PacketizedElementaryStream)。
广而言之,PES为打包了的专用视频、音频、数据、同步、识别信息数据通道。
节目流(PS)将具有共同时间基准的一个或多个PES组合(复合)而成的单一的数据流称为节目流(ProgramStream)。
PS包由包头、系统头、PES包3部分构成。
包头由PS包起始码、系统时钟基准(SCR-SystemClockReference)的基本部分、SCR的扩展部分和PS复用速率4部分组成。
传输流(TS)将具有共同时间基准或具有独立时间基准的一个或多个PES组合而成的单一的数据流称为传输流(TransportStream)。
TS实际是面向数字化分配媒介(有线、卫星、地面网)的传输层接口。
对具有共同时间基准的两个以上的PES先进行节目复用,然后再对相互可有独立时间基准的各个PS进行传输复用,即将每个PES再细分为更小的TS包。
4.系统的解码
由前述,MPEG-2系统要解决的问题是:
1)系统的复用与解复用
MPEG-2采用时分多路复用技术,让多路信号在同一信道上占用不同的时隙进行存储和传输,以提高信道利用率。
2)声音图像要同步显示
由于时分多路复用中的位时隙、路时隙、帧之间具有严格的时间关系,这就是同步。
区分各路信号以此为据。
为了恢复节目,先对ES进行解码。
声音、图像信号的重现需要同步显示,从而要求收发两端数据流要达到同步。
为此,MPEG-2系统规范通过在数据中插入时间标志来实现:
SCR或PCR为重建系统时间基准的绝对时标;在有效PS和TS产生前,已插入PES的DTS和PTS为解码和重现时刻的相对时标。
3)解码缓存器无上下溢
MPEG-2系统是由视音频编码器、编码缓存器、系统编码器及复用器、信道网络编解码器及存储环境编解码器、系统解码器及解复用器、解码缓存器和视音频解码器构成。
其中,编码缓存器和解码缓存器延迟是可变的;信道网络编解码器及存储环境编解码器和从视/音频编码器输入到视音频解码器输出,延迟是固定的。
这表明,输入视/音频编码器的数字图像和音频取样,经过固定的、不能变的点到点延迟后,应该精确地同时出现在视音频解码器的输出端。
编码及解码缓存器的可变延迟的范围就应该受到严格限制,使解码缓存器无上、下溢。
为了解决复用、同步、无溢出问题,需要定义1个系统目标解码器(STD-SystemTargetDecoder)模型。
用于解释传输流TS解码并恢复基本流ES时的过程;用于在复用器数据包交织时确定某些时间的边界条件。
因此,每个相应的MPEG-2TS必须借助于专门的解码器模型来解码。
下图为TS的系统目标解码器模型。
5、MPEG-2的编码
编码是MPEG-2标准的核心内容之一,其涉及到MPEG-2视频流层结构、MPEG-2帧间编码结构、MPEG-2的类与级、MPEG-2运动估值等技术。
MPEG-2视频流层结构为了便利于误码处理、随机搜索及编辑,MPEG-2用句法定义了1个层次性结构,用于表示视频编码数据。
将MPEG-2视频流分为图像序列层(VSL-VideoSequenceLayer)、图像组层(GOPL-GroupofPicturesLayer)、图像层(PL-PictureLayer)、宏块条层(SL-SliceLayer)、宏块层(ML-MacroblockLayer)、块层(BL-BlockLayer)共6个部分,每层都有确定的功能与其对应。
6、MPEG-2视频压缩基础
码率压缩要从视觉对象、视觉生理、视觉心理3个方面入手,研究符合于人类视觉规律的视觉模型。
由于视觉心理是1个很复杂的问题,难以得到其规律。
因此,码率压缩只能在利用图像信号的统计特性和人类眼睛的视觉特性的基础上来进行。
1)利用图像信号的统计特性进行压缩
同一帧电视图像中相邻像素之间的幅度值相近,即同一行上的相邻像素之间幅值相近,相邻行之间同样位置上的像素幅值相近,体现了电视图像的空间冗余度;相邻两帧电视图像同一位置上像素幅度值相近,体现了电视图像的时间(动态)冗余度每个像素所用bits数的多少表示了比特结构,多用的比特数为冗余量,体现了静态(比特结构)冗余度。
因此,为了清楚地了解空间冗余度、时间冗余度和静态冗余度三者之间的关系,可以通过电视图像信息的三维表示来说明。
需要指出的是采用运动补偿(MC)去除时间冗余度要进行160亿次的算术运算;采用离散余弦变换(DCT)和游程长度编码(RLC)去除空间冗余度要进行20亿次的算术运算;采用可变长度编码(VLC)去除静态(比特结构)冗余度要象“MorseCode”那样进行比特匹配。
2)利用人眼的视觉特性进行压缩
人眼对构成图像的不同频率成分、物体的不同运动程度等具有不同的敏感度,这是由人眼的视觉特性所决定的,如人的眼睛含有对亮度敏感的柱状细胞1.8亿个,含有对色彩敏感的椎状细胞0.08亿个,由于柱状细胞的数量远大于椎状细胞,所以眼睛对亮度的敏感程度要大于对色彩的敏感程度。
据此,可控制图像适合于人眼的视觉特性,从而达到压缩图像数据量的目的。
例如,人眼对低频信号的敏感程度大于对高频信号的敏感程度,可用较少的bit数来表示高频信号;人眼对静态物体的敏感程度大于对动态物体的敏感程度,可减少表示动态物体的bit数;人眼对亮度信号的敏感程度大于对色度信号的敏感程度,可在行、帧方向缩减表示色度信号的bit数;人眼对图像中心信息的敏感程度大于对图像边缘信息的敏感程度,可对边缘信息少分配bit数;人眼对图像水平向及垂直向信息敏感于倾斜向信息,可减少表示倾斜向信息高频成分的bit数等。
在实际工作中,由于眼睛对亮度、色度敏感程度不一样,故可将其分开处理。
为此,将单元分量RGB改变为YUV(或YCrCb)全分量。
在编码时强调亮度信息,可去掉一些色度信息,如4:
4:
4变为4:
2:
2,码率由270Mbps降低到180Mbps。
由上述可见,电视系统存在着冗余信息,在传输图像信息之前,只要将这些冗余信息去除,就可以实现适度的压缩。
由于去除这些冗余信息对图像质量无影响,故称其为“无损压缩”。
如,从视频信号中去除同步信息。
无损压缩的压缩比不高,压缩能力有限。
为了提高压缩比,MPEG标准采用了对图像质量有损伤的“有损压缩”技术。
三、数字信号的调制
数字电视的传输方式有三种,一种是卫星传输,一种是有线传输,一种是地面传输。
这三种数字电视的信源编码都采用MPEG-2的复用数据包,但由于它们的传输途径不同,因而在信道编码方面采用不同的调制方式。
主要有以下方式:
1.正交振幅调制(QAM):
这是近年来被国际上移动通信技术专家十分重视的一种信号调制方式,正交振幅调制是用两个独立的基带数字信号对两个相互正交的同频载波进行抑制载波的双边带调制,利用这种已调信号在同一带宽内频谱正交的性质来实现两路并行的数字信息传输。
它的调制效率高,要求传送途径的信噪比高,它主要用于有线电视电缆传输。
2.键控移相调制(QPSK):
在数字信号的调制方式中,QPSK四相移键控是目前最常用的一种卫星数字信号调制方式,它具有较高的频谱利用率、较强的抗干扰性,在电路上实现也较为简单。
所以它的调制效率高,要求传送途径的信噪比低,用于卫星广播传输方式。
3.残留边带调制(VSB):
VSB是介于SSB与DSB之间的一种调制方式,在VSB中,设法让一个边带通过,同时又保留另一个边带的一部分,因此这种方法称为残留边带调制。
抗多径(即重影)传播效应好,适合地面广播。
4.编码正交频分调制(COFDM):
它的基本思想通过采用允许子信道