广播电视资料.docx
《广播电视资料.docx》由会员分享,可在线阅读,更多相关《广播电视资料.docx(17页珍藏版)》请在冰豆网上搜索。
![广播电视资料.docx](https://file1.bdocx.com/fileroot1/2022-12/11/e87b97d7-bf4e-417c-bdea-10c7b074fffa/e87b97d7-bf4e-417c-bdea-10c7b074fffa1.gif)
广播电视资料
1、广播电视台与数字化
广播电视为什么要数字化:
当前,广播电视正在全面数字化;
因为整个信息行业已经数字化,我们的竞争对手也已经数字化;
我们的内部环境也具备数字化的条件;
数字化的优点:
1)数字信号处理、传输使信号质量大大提高,数字信号在记录/重放、信号传输和处理等过程中不会引起信号劣化,通过整形和纠错编码等技术可将数字信号有效还原,收端图像质量与发端基本一致。
数字电视,比特率为4~5Mb/s的信号,传输到用户清晰度达到480线,主观评价约4.3分。
而模拟信号只有3分左右。
(模拟电视经电视中心、微波、卫星、发射机和接收机各环节后,按五级质量制评定只有3.25分)。
2)频谱资源利用率高:
电视数字化,节目容量大大提高。
如1个8MHz模拟频道可以传6~10套数字电视节目。
500MHz带宽内可以传380~630套节目。
HFC网络改造(1G)会使容量进一步提高。
3)多信息、多功能:
数字技术有利于电视节目与数据的融合。
大大扩展服务内容。
如电子节目指南、财经信息、视频点播、歌唱点播、新闻选取、远程教育、电视购物、交互游戏等新颖的增值服务。
4)数字化带来有效的用户管理系统:
数字化使得信号非常容易实现加扰、解扰和加密、解密,便于开展各类收费业务。
条件接收(CA)系统的应用,可以实现对用户的有效管理,确保运营商的资金回报。
怎样学习数字电视编码技术:
复习好模拟信号的有关内容,因为这是基础;数字电视广播包括编码和调制两部分,而核心部分是编码技术;对广播电视系统的不同部分,重点有所不同;编码的内容广泛,有深有浅,学什么要根据需要;从事研究、开发的,要深入到数学等领域;从事具体应用的、值班的,要掌握原理的要领;有些基本的概念要补学,比如电视原理、信息论、数字逻辑运算等等;
数字化的基本思路:
先把模拟信号变为数字信号,得到普通(未压缩)数字码流;再把普通数字码流变为压缩的数字码流;了解压缩的方法、各种压缩方法的原理;了解一个压缩标准(如MPEG-2)的码流结构,然后举一反三;
电视信号的类型和演变:
•黑白电视信号(模拟);彩色电视信号(模拟);数字电视信号(未压缩);数字电视信号(压缩);不同标准的数字电视信号(压缩);不同的数字电视接口;
电视信号的基本概念:
•象素(光如何变为电信号);扫描(顺序、隔行)、行、场、帧、奇数场、偶数场;
•黑电平、白电平、消隐(行消隐、场消隐)和同步(行同步和场同步)信号、均衡脉冲;
•黑白全电视信号的组成
色电视信号:
•三基色原理:
R、G、B和Y、R-Y、B-Y;彩色电视信号的产生、彩色电视如何与黑白电视兼容、彩色电视的副载波;色同步信号;分量信号和复合信号;模拟电视信号的三大制式;PAL-D模拟广播制式的特点
编码的基本概念:
“编码”含义很多,如‘图书编码’、商品的编码等等,这里说的是电视信号的编码;
什么是模拟信号?
什么是数字信号?
有人说“数字化时代了,信号都是0和1了,没有差别了!
”是否真的如此?
把模拟信号简单变为数字信号,除了带宽大大增加以外,基本没有什么意义。
数字化的优点必须通过编码才可以实现。
数字电视信号的产生:
•直接产生:
字幕机,数字摄像机等,转换生产:
电影胶片——电视电影机,模拟-数字(A/D转换)——信号数字化,信号数字化的过程:
取样—时间的离散化;量化—空间(数值)的离散化;编码;
信号数字化过程
(一):
取样:
取样频率,Nyquist定理,把连续信号变换成离散信号,
信号数字化过程
(二):
•量化:
将离散信号样值进行离散化处理;离散化的量化级
信号数字化过程(三)
编码:
量化后的信号仍然只是离散信号,还不是数字信号。
用n比特二进制码来表示已经量化了的取样值,称为编码。
常用的是8比特或10比特。
每个二进制数对应一个量化电平,再按时序将它们排列起来,就得到基带数字信息流。
这个码流只有0和1。
演播室里用的信号是SDI信号。
传输速率:
传输速率=取样频率fs×量化比特数
视频信号的数字化:
编码方式:
复合编码——将彩色全电视信息直接编成PCM码,分量编码——将亮度信号Y,色差信号R-Y和B-Y分别编码或PCM码
复合编码与分量编码的比较:
“复合编码”与电视制式有关,“分量编码”与电视制式无关
在节目后期制作中:
“复合”需解码。
“分量”无需解码。
传输时:
“复合”由于频分复用,产生亮,色串扰,“分量”采用时分复用,无亮,色串扰。
ITU-R601建议编码主要参数(4:
4:
4格式):
参数625行50场/s制式525行60场/s制式
1,编码信号经过γ校正的信号EY,ER-EY,EB-EY或ER,EG,EB
2,各信号的全行样点数864858
3,取样结构正交,按场,行,帧重复,并与此4:
2:
2标准的亮度样点重合
4,每种信号的取样频率13.5MHz
5,编码方式每样值至少8比特均匀量化PCM
6,用样点表示的数字
有效行长度至少720
7,视频信号电平每样值共220量化级,黑电平对应于第16量化级;
8比特的最高有效位峰值白电平相应于第235量化级
(MSB)量化级之间的在量化等级中部共分224级,零电平对应128级
对应值(范围:
0—255)
ITU-R601建议演播室分量编码主要参数(4∶2∶2格式):
参数
625行50场/s制式525行60场/s制式
1、编码信号Y、R-Y、B-Y
2、全行样点数
亮度信号(Y)864858
每个色差信号(R-Y、B-Y)432429
3、取样结构
正交,场、行、帧重复,R-Y和B-Y的样点同位,并和每行第奇数个(1,3,5...)Y样点同位
4、取样频率
亮度信号13.5MHz
每个色差信号6.75MHz
5、编码方式线性PCM、8比特量化/每个取样值
6、每数字有效行数样点数
亮度信号720
每个色差信号360
7、视频信号电平与量化级间的对应值
亮度信号
每个色差信号
共22个量化级,黑电平对应量化级16;峰值白电平对应量化级235
在量化等级中间部,共分224级,零电平对应于128级
数字电视信号接口和格式:
•数字电视中大量使用英文缩写,应当注意它们是什么意思;数字电视信号的接口和数字电视信号的格式是不同的概念,也要区分;如SDI,HD-SDI,ASI,SSI等这些是接口;MPEG-II,H.264,TS流等是信号格式;
(简化的)数字电视系统基本构成
SDI信号:
SDI标清电视信号是数字信号,数字信号特点:
是“1”、“0”两个值的信号,信号失真不累加,它便于和计算机共同使用,使设备多功能化、自动化,便于实现数字压缩、编码,显出数字化优越性,使系统多功能化,一机多用、三网合一
数字视频压缩的必要性:
HDTV1920×1080显示格式
数字化后传输速率995Mb/S
SDTV复合编码135Mb/S
分量编码4:
2:
2216Mb/S
传输:
HDTV需1Gb/S信道
SDTV需1~2个155Mb/S信道
可见,无论对于传输还是广播,码率压缩都是绝对必要的。
编码的基本概念-码有多少种?
•编码的本质是“算法”;按用途分:
信源编码和信道编码、加密用的编码等等;信源编码的目的是压缩;信道编码的目的是抗干扰;按性质分:
无失真编码和有失真编码、按对象分:
音频、视频、数据;
码流为什么能够压缩?
•因为图像里有冗余,即不必要的部分;利用事件的统计特性与统计冗余度的压缩;
•利用人眼的视觉特性与视觉冗余度的压缩;
码流为什么能够压缩(续)
•冗余就是多余的东西,它和相关性有关;电视画面有时间相关性和空间相关性;
•电视图象中相继各帧对应象素点的值往往相近或相同,具有时间相关性,找出这些相关性就可以减小信息量,从而实现与时间有关的压缩。
一幅图象相邻各点的取值往往相近或相同,具有空间相关性,找出这些相关性就可以减少信息量,从而实现与空间有关的压缩。
对经常出现的数据用短码组表,对不经常出现的数据用长码组表示,则最终用于表示这一串数据的总码位就减少了。
从而实现与统计冗余有关的压缩。
莫尔斯电报就是典型的例子:
最常用的e和t分别用一点、一划表示,出现率很低的q则用.___表示;人眼的视觉特性:
对亮度信号比对色度信号敏感;对低频信号比对高频信号敏感;对静止图象比对运动图象敏感;对图象中水平和垂直线条比对斜线条敏感;包含在色度信号、图象高频信号和运动图象中的一些数据并不能对增加图象相对于人眼清晰度作出贡献,而被认为是多余的数据,这就是视觉冗余度。
压缩视觉冗余度就是去掉那些相对人眼而言是看不到的或者可有可无的图象数据。
基本的压缩编码技术:
无论哪种标准,实际都采用了多种压缩技术;压缩技术类型多(见下表),原理各不相同;
注意区分两大类方法:
无损压缩:
又叫冗余度压缩技术,无损伤压缩技术。
它们无失真,数学上可逆。
即它是可还原的,这类编码称为熵编码。
有损压缩:
又叫信息量压缩技术,有损伤压缩技术。
它们有失真,数学上不可逆。
即它是不可还原的。
基本压缩编码方法之一:
预测编码例1——差分脉冲编码调(DPCM)
DPCM不直接传送图象样值本身,而是对实际样值与它的一个预测值之间的差值进行再次量化、编码。
这种方法可消除图象信号的空间相关冗余(帧内预测)和时间相关冗余(帧间预测)。
利用象素的相关性还可进一步减小差值。
DPCM系统原理图:
基本压缩编码方法之二:
离散余弦变换(DCT)
DCT(DiscreteCosineTransform)是数码率压缩的一种常用的变换编码方法。
DCT是先将整体图像分成NN像素块,然后对NN像素块逐一进行DCT变换。
由于多数图像高频分量较少,相应图像高频分量的系数经常为零,加之人眼对高频成分的失真不太敏感,所以可用更粗的量化。
因此传送变换系数的数码率,要大大小于传送像素所用的数码率。
到达接收端后通过反离散余弦变换回到样值。
虽有失真,但人眼是可以接受的。
(DCT来源于傅里叶变换,只不过在电脑时代才可以用于图像处理)
基本压缩编码方法之三:
霍夫曼(Hoffman)编码
霍夫曼(Hoffman)编码(属于统计编码)是可变字长编码(VLC:
Variable-LengthCoding)的一种,相当于对概率大的符号给短码,对概率小的符号给长码。
附图是霍夫曼编码的具体方法:
1)先按出现的概率大小排队,把两个最小的概率相加,作为新的概率和剩余的概率重新排队。
2)再把最小的两个概率相加,再重新排队,直到最后变成1。
3)每次相加时都将“0”和“1”赋与相加的两个概率,读出时由该符号开始一直走到最后的“1”,将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的霍夫曼编码。
霍夫曼编码有一个好处,就是任何短码都不会是长码的起始部分,也就是不会出现一对像011和01101这样的码组。
这样就可以把各码字直接相连而不需要增加其它形式的同步间隔。
霍夫曼编码既然属于统计编码,它要求事先知道各信源符号出现的概率,否则编码的效率会明显下降。
游程长度编码(RunlengthEncoding):
游程编码(RLC)是一种十分简单的压缩方法,它将数据流中连续出现的字符用单一的记号来表示。
例如,字符串5310000000000110000000012000000000000可以压缩为5310-10110-08120-12,其中,“-”后面两个数字是“-”前面数字的连续个数。
通常,DCT系数量化之后,都采用之字形方式读出。
在用之字形读出方式情况下,出现连零的机会较多,尤其在最后,如果都是零,在读到最后一个数后只要给出“块结束”(EOB)码,就可以结束输出,从而节省很多码率。
游程编码的压缩率不高,但编码、解码的速度快,仍被得到广泛的应用,特别是在变换编码后再进行游程编码,有很好的效果。
小波变换编码:
•小波是什么?
傅里叶变换的“基底”是正弦波;傅里叶变换有缺点和限制;用其他的“波”做基底行不行?
小波(Wavelet)由此产生,而且解决了傅里叶变换的不足;
小波的基本概念——什么是小波
信号的时域表示和频域表示只适用于平稳信号,对于非平稳信号,在时间域各种时间统计量会随着时间的变化而变化,失去统计意义;而在频率域,由于非平稳信号频谱结构随时间的变化而变化导致谱值失去意义,时频表示主要目的在于实现对非平稳信号的分析,同样的可以应用于平稳信号的分析
为什么选择小波
小波提供了一种非平稳信号的时间-尺度分析手段,不同于傅里叶变换方法以及改进了的傅里叶变小波的发展历史
小波的发展历史:
•1807:
JosephFourier——FT,只有频率分辨率而没有时间分辨率
•1909:
AlfredHaar——发现了Haar小波
•1945:
Gabor——STFT
•1980:
Morlet——Morlet小波,并分别与20世纪70年代提出了小波变换的概念,20世纪80年代开发出了连续小波变换CWT(continuouswavelettransform)
•1986:
Y.Meyer——提出了第一个正交小波Meyer小波
•1988:
StephaneMallat——Mallat快速算法(塔式分解和重构算法)
•1988:
InridDaubechies作为小波的创始人,揭示了小波变换和滤波器组(filterbanks)之间的内在关系,使离散小波分析变成为现实
•RonaldCoifman和VictorWickerhauser等著名科学家在把小波理论引入到工程应用方面做出了极其重要贡献
•在信号处理领域中,自从InridDaubechies完善了小波变换的数学理论和StephaneMallat构造了小波分解和重构的快速算法后,小波变换在各个工程领域中得到了广泛的应用,典型的如语音信号处理、医学信号处理、图像信息处理等
非标准分解
•非标准分解是指使用一维小波交替地对每一行和每一列像素值进行变换。
首先对图像的每一行计算像素对的均值和差值,然后对每一列计算像素对的均值和差值。
这样得到的变换结果只有1/4的像素包含均值,再对这1/4的均值重复计算行和列的均值和差值,依此类推。
非标准分解的过程如下:
行、列变换
分形变换编码
•分形(Fractal)是几何学里的一个分支,对象是“自相似”的几何图形;
•分形几何的历史:
萌芽期:
十九世纪末,二十世纪初;当时推出了Cantor集,Weierstrass函数等。
形成期:
二十世纪六、七十年代;Mandelbrot的大量工作.1.1967年,“Science”杂志提出,英国的海岸线究竟有多长?
2.1975年,《分形对象:
形,机遇和维数》一书出版;分形(fractal)这个词源于这本书.它是从拉丁语“fractus”派生出来的,意思是“不规则的或者断裂的”。
•发展期:
二十世纪八十年代至现今:
1.Hutchinson,1981,分形与自相似.
•给出了自相似集合的数学理论基础.2.Mandelbrot,1982,《自然界的分形几何》3.Barnsley,1988,《Fractaleverywhere》4.Falconer,1990,《分形几何——数学基础及其应用》.
•分形几何的应用:
图像,数据压缩方面的研究。
如:
对某一个静态场景的分形压缩。
(压缩比可达近万倍)自然景物的模拟如:
雪花,海岸线,分形山,分形树叶,分形生长模型。
信源编码
•信源编码的目的:
压缩带宽(码率);信源编码的手段(方法)很多,不一定全部都用上,需要考虑效率和计算量;不同的信源编码标准差别在于方法的数量不同,因而效率不同、码流的结构也不同;但它们的基本方法大同小异。
关于视音频压缩编码标准
•:
MPEG-1、JPEG、MPEG-2、MPEG-4、MPEG-7、H.261、H.263、H.264、AVS、HEVC/AVC;
MPEG-2编码的基本原理
•编码实际上分硬件和软件两部分;初期是以通用硬件加软件;随着技术的发展,专用硬件的比例逐步增加;既要了解方框图,也要了解码流的结构;编码的程序十分专业,需要专门学习。
MPEG-2中的码流:
•MPEG-2的结构可分为压缩层和系统层。
一路节目的视频、音频及其它辅助数据经过数字化后,通过压缩层完成信源压缩编码,分别形成视频的基本流ES(ElementaryStream)、音频的基本流和其它辅助数据的基本流。
紧接着,系统层将不同的基本流分别加包头打包(分组)为PES(PacketizedES,打包基本流)包。
PES又称为分组基本码流。
然后,多个PES被复接成一个节目码流(PS)和一个传输码流(TS)
数字电视码流的多个层次:
•ES:
基本码流,PES:
打包的基本码流,PS:
节目流,TS:
传输流
•基本码流(ES):
•视频信号压缩到1Mbit/s(MPEG-1)或2~6Mbit/s(MPEG-2);音频信号压缩到100~400kbit/s;压缩后的视音频信号称作ES(elementarystream)流,包括视频流和音频流;一路节目的视频、音频及其它辅助数据经过数字化后,通过压缩层完成信源压缩编码,形成基本流ES(ElementaryStream)、包括视频的、音频的和其它辅助数据的基本流。
ES的结构和内容根据各种数据的编码格式而不同。
PES流
•压缩后所有ES流被打成不同长度的包,叫做PES(packetizedelementarystreams)。
•根据不同时刻视音频内容的不同,压缩比也时刻变化,就需要有不同长度的数据包。
•每个视频包有一个或几个压缩视频帧,每个音频包有一个或多个压缩音频信号段
•所有ES流首先被打包成不同长度的PES包,通常为64kbytes(字节)。
•开头为6字节的PES头:
前3个字节是起始码前缀000001,用于表明一个PES包的开始。
第4个字节是起始码标志,说明起始码种类,表明净负荷数据(payload)中的是视频、音频还是数据流。
后两个字节是包长度,说明后面还有多少字节。
如果长度为0,表示PES包大于64kbytes;然后是可选PES头;最后是实际传送ES流的净负荷数据。
可选PES头:
•PES头的可选扩展,根据当前传送ES流的要求设置。
由12个比特的11个标志来控制可选PES头中包含哪些字段,其中有PTS(presentationtimestamps)和DTS(decodingtimestamps),这对视/音频同步非常重要。
最后可能有填充字节。
由于MPEG只定义了传输流,而没有对编码器作出规定,设计者可以选择构建一个将基本码流转换为传输流的多路复用器。
在这种情况下,PES包就不再以可识别的形式存在,而是以逻辑形式存在于传输流的有效载荷中。
节目码流(PS)
•将具有共同时间基准的一个或多个PES组合(复合)而成的单一的数据流称为节目流(ProgramStream)。
PS的形成:
•其一是将视频ES、音频ES、其他ES分别打包成视频PES包、音频PES包、其他PES包:
使每个PES包内只能存在1种性质的ES;每个PES包的第一个AU的包头可包含PTS和DTS;每个PES包的包头都有用于区别不同性质ES的数据流识别码。
这一切,使解复用和不同ES之间同步重放成为可能。
其二是通过PS复用器将PES包复用成PS包,即将每个PES包再细分为更小的PS包。
PS包头含有从数字存储媒介(DSM-DigitalstorageMedium)进入系统解码器各个字节的解码专用时标,即预定到达时间表,它是时钟调整和缓存器管理的参数。
PS包长度比较长且可变,适用于无误码环境,适合于节目信息的软件处理及交互多媒体应用。
但是,PS包越长,同步越困难;在丢包时数据的重新组成,也越困难。
因此PS用于存储(磁盘、磁带等)、演播室CD-I、MPEG-1数据流。
TS传输层基本原理
•传输流TS:
将具有共同时间基准或具有独立时间基准的一个或多个PES组合而成的单一的数据流称为传输流(TransportStream)。
传输流是许多种PES包的多路复用。
header包含了对包传输过程非常重要的信息:
•同步字节:
固定值47hex,在TS流中的间隔也固定。
码流中其他位置也可能出现47hex,因此同步字节利用固定数值和固定间隔两方面联合实现同步。
解码器在接收到5个TS包后开始同步。
同步字节是作为解码器识别用的,从而可对包头和有效载荷进行串并转换。
传输差错标志:
由解调器在传输信道末端设置,在传输层之上的错误校正层中,如果原始误码率(BER)太高而无法校正时,通过它的设置可以指示传输流包中可能含有错误,13bit的PID(packetidentifier):
描述该包中payload的内容以及该包属于哪个ES流。
有时TS包的头长度必须大于4个byte:
包头扩展到payload中,payload长度相应缩短,但总包长度仍是188bytes。
扩展的包头称作“adaptationfield”。
在4bytes的包头中由Adaptationcontrolbits标志是否有adaptationfield。
除了同步字节、传输误码标识和PID以外,TS头还包括:
•PayloadUnitStartIndicator一个比特来标记一个payload的开始,如果该比特为1,表示该TS包是一个新payload的开始,该TS包包含了视频或音频PES包和PES头的开始,或者是表的开始,此时TS包的payload第一个字节为tableID。
TransportPriority一个比特,表示该TS包比其他相同PID的TS包的优先级更高。
除了同步字节、传输误码标识和PID以外,TS头还包括:
•TransportScrambingControlBits两个比特,标记TS包的payload部分是否被混杂。
如果两个比特都为0,表示payload没有混杂。
如果其中有一个比特不为0,表示payload进行了混杂,需要CAT来解扰。
AdaptationFieldControlBits两个比特,标记是否有扩展头adaptationfield,如果两个比特都为0,表示没有adaptationfield
•如果有adaptationfield,payload变短,头变长,但总包长度保持188字节。
ContinuityCounter,每个具有相同PID的TS包带有自身的4bit计数器。
从0到15连续计数TS包数目,到15以后重新从0开始。
可以发现丢失TS包的情况,并识别码流错误(计数不连续)。
允许在改变节目时出现不连续计数,由adaptationfield中的DiscontinuityIndicator来标记。
•在节目流中,由于音频和视频均锁定于一个公共时钟,因此可利用其时间标记以重建时间轴。
传输流携带有许多不同的节目,每个节目都可以使用不同的压缩因子并具有不同的比特率。
在传输流中就必须含有重建稳定时钟的附加数据。
传输流必须为每个节目提供各自独立的同步。
•
对TS包再进行复用:
•先复用同一个节目的TS包,一个节目可包含一个或多个视频和音频信号(如不同角度摄像机、不同语言等)。
所有节目的所有复用数据流再进行复用形成最终的TS流。
MPEG-1,视频PES包与音频PES包复用,最大码率为1.5Mbit/s,用于VCD。