DCT及JPEG编码Word文档下载推荐.docx-资源下载

DCT及JPEG编码Word文档下载推荐.docx

1、JPEG-LS是JPEG标准中无损模式的补充和强调，采用的是LOCO-I（LOw COmplexity LOssless COmpression for Images，图像的低复杂性无损压缩）算法，主要应用于对图像质量要求较高的一些专门领域（如遥感和医学图像），由于时间和篇幅的限制，本书不作介绍。2000年12月JPEG在JBIG（Joint Bi-level Image experts Group联合二值图像专家组）的帮助下又推出了比JPEG标准的压缩率更高、性能更优越的JPEG 2000标准ISO/IEC 15444 （ITU T.800808）JPEG 2000图像编码系统，适用于二值图

2、、灰度图、伪彩图和真彩图的静态图像压缩。8.2.1 JPEG标准系列JPEG标准ISO/IEC 10918:1992 - Digital compression and coding of continuous-tone still images（连续色调静态图像的数字压缩与编码）（ITU T.81、T.83、T.84、T.86）（参见网站www.jpeg.org、www.iso.org、www.itu.org 和www.iec.ch）被分成如下4个部分：ISO/IEC 10918-1:1994 Information technology - Digital compression and

3、coding of continuous-tone still images: Requirements and guidelines（需求与指导方针）1994/Cor 1:2005 Patent information update（专利信息更新） ISO/IEC 10918-2:1995 Information technology - Digital compression and coding of continuous-tone still images: Compliance testing（顺从测试）ISO/IEC 10918-3:1997 Information technol

4、ogy - Digital compression and coding of continuous-tone still images: Extensions（扩展）1997/Amd 1:1999 Provisions to allow registration of new compression types and versions in the SPIFF header（可供在SPIFF头中注册新压缩类型和版本）ISO/IEC 10918-4:1999 Information technology - Digital compression and coding of continuo

5、us-tone still images: Registration of JPEG profiles, SPIFF profiles, SPIFF tags, SPIFF colour spaces, APPn markers, SPIFF compression types and Registration Authorities （REGAUT）（注册JPEG简表、SPIFF简表、SPIFF标签、SPIFF颜色空间、APPn标记、SPIFF压缩类型和注册权限）8.2.2 压缩算法JPEG专家组开发了两种基本的压缩算法，一种是采用以DCT为基础的有损压缩算法，另一种是采用以预测技术为基础的

6、无损压缩算法。编码模式在JPEG标准中定义了四种编码模式：无损模式：基于DPCM 基准模式：基于DCT，一遍扫描递进模式：基于DCT，从粗到细多遍扫描层次模式：含多种分辨率的图（2 n倍）这四种模式的关系参见图8-2。基准无损递进层次图8-2 JPEG编码模式的关系图本节只介绍应用最广泛的基于DCT有损压缩算法的基线（baseline）模式中的顺序（sequential）处理所对应的算法和格式（其熵编码只使用Huffman编码，而在扩展的基于DCT的无损压缩算法中，既可以使用Huffman编码，又可以使用算术编码）。JPEG在使用DCT进行有损压缩时，压缩比可调整，在压缩1030倍

7、后，图像效果仍然不错，因此得到了广泛的应用（尤其是网络），参见表8-1。表8-1 JPEG图像的压缩比与质量压缩倍数比特率（bit/pixel）图像质量12 162.0 1.5同原图16 321.5 0.75很好32 480.75 0.5好48 960.5 0.25中等算法概要JPEG压缩是有损压缩，它利用了人的视觉系统的特性，使用量化和无损压缩编码相结合来去掉视角的冗余信息和数据本身的冗余信息。JPEG属于结合变换编码（DCT）与熵编码（RLE/Huffman）的混合编码。JPEG算法框图如图8-3所示：图8-3 JPEG压缩编码-解压缩算法框图JPEG的压缩编码可以分成如下三个主要步骤：

8、（1）使用FDCT把空间域表示的图像变换成频率域表示的图像。（2）使用（对于人的视觉系统是最佳的）加权函数对DCT系数进行量化。（3）使用Huffman可变字长编码器对量化系数进行编码。译码（解压缩）的过程与压缩编码过程正好相反。另外，JPEG算法与彩色空间无关，因此在JPEG算法中没有包含对颜色空间的变换。JPEG算法处理的彩色图像是单独的颜色分量图像，因此它可以压缩来自不同彩色空间的数据，如RGB、YCbCr和CMYK等。 8.2.3 编码步骤JPEG压缩编码算法的主要计算步骤如下：（0） 8*8分块。（1）正向离散余弦变换（FDCT）。（2）量化（quantization）。（

9、3） Z字形编码（zigzag scan）。（4）使用差分脉冲编码调制（DPCM）对直流系数（DC）进行编码。（5）使用行程长度编码（RLE）对交流系数（AC）进行编码。（6）熵编码。下面分别加以介绍。1. 正向离散余弦变换JPEG编码是对每个单独的颜色图像分量分别进行的，在进行正向离散余弦变换（FDCT = Forward Discrete Cosine Transform）之前，需要先将整个分量图像分成88像素的图像块（不足部分可以通过重复图像的最后一行/列来填充），这些图像块被作为二维正向离散余弦变换（FDCT）的输入。参见图8-4。图8-4 离散余弦变换JPEG编码的DCT变换使

10、用下式计算（注意，在变换之前，需要先对源图像中的每个样本数据v减去128），f（i,j） = v（i,j） 128其中，并称为直流系数，称其他F （u , v）为交流系数。它的逆变换使用下式计算：在计算二维的DCT变换时，可使用下式将二维的DCT变换转换成一维的DCT变换，如图8-5所示。图8-5 二维DCT变换方法2. 量化量化（quantization）是对经过FDCT变换后的频率系数进行量化。量化的目的是减小非“0”系数的幅度以及增加“0”值系数的数目。量化是使图像质量下降的最主要原因。对于JPEG的有损压缩算法，使用的是如图8-6所示的均匀量化器进行量化，量化步距是按照系数所在的位置

11、和每种颜色分量的色调值来确定的。图8-6 均匀量化器因为人眼对亮度信号比对色差信号更敏感，因此JPEG编码中使用了两种标准的量化表：亮度量化表和色差量化表，参见表8-2。此外，由于人眼对低频分量的图像比对高频分量的图像更敏感，因此表中的左上角的量化步距要比右下角的量化步距小。这两个表中的数值对CCIR 601标准电视图像已经是最佳的。如果不想使用这两种标准表，你也可以用自己的量化表替换它们。表8-2 标准量化表色差量化值亮度量化值1611102440516117184799121419265860552166135769562229878062376810910377356481104113

12、924978121120101729598112100量化的具体计算公式为：其中，Sq （u,v）为量化后的结果、F （u,v）为DCT系数、Q （u,v）为量化表中的数值、round为舍入取整函数。3Z字形编排量化后的二维系数要重新编排，并转换为一维系数，为了增加连续的“0”系数的个数，就是“0”的游程长度，JPEG编码中采用的Z字形编排方法，如图8-7所示。图8-7 量化DCT系数的编排DCT系数的序号如表8-3所示，这样就把一个88的矩阵变成一个1 64的矢量，频率较低的系数放在矢量的头部。表8-3 Z字形排列的量化DCT系数之序号1561527282474238253041439314

13、453233239455254203338463450593648634. 直流系数的编码88图像块经过DCT变换之后得到的DC直流系数有两个特点，一是系数的数值比较大，二是相邻88图像块的DC系数值变化不大。根据这些特点，JPEG算法使用了差分脉冲编码调制（DPCM）技术，对相邻图像块之间的DC系数的差值进行编码， DC（0, 0） k - DC（0, 0） k-15. 交流系数的编码量化AC系数的特点是163矢量中包含有许多“0”系数，并且许多“0”是连续的，因此使用非常简单和直观的游程长度编码（RLE）对它们进行编码。JPEG使用了1个字节的高4位来表示连续“0”的个数，而使用它的低4位

14、来表示编码下一个非“0”系数所需要的位数，跟在它后面的是量化AC系数的数值。6. 熵编码使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。在JPEG有损压缩算法中，可以使用Huffman或算术编码来减少熵，这里只介绍最常用的Huffman编码。使用Huffman编码器的理由是可以使用很简单的查表（lookup table）方法进行快速的编码。压缩数据符号时，Huffman编码器对出现频度比较高的符号分配比较短的代码，而对出现频度较低的符号分配比较长的代码。这种可变长度的Huffman码表可以事先进行定义（标准H表）。表8-4所示的是DC码表符号举例。如果

15、DC的值（Value）为4，符号SS.S用于表达实际值所需要的二进制位数，SSS的实际位数就等于3。表8-4 DC码表符号举例ValueSSS-1, 1-3, -2, 2, 3-7.-4, 4.7表8-5/6分别是JPEG标准提供的亮度与色差DC系数差的Huffman编码表：表8-5 标准亮度DC系数差的H表表8-5 标准色差DC系数差的H表表8-7/8分别是是JPEG标准提供的亮度与色差的AC系数的Huffman编码表的开始部分（每个完整的表有162项），至于完整码表参见标准文档。表8-7 标准亮度AC系数差的H表的开始部分表8-8 标准色差AC系数差的H表的开始部分7. 组成位数据流JPE

16、G编码的最后一个步骤是把各种标记代码和编码后的图像数据组成一帧一帧的数据，这样做的目的是为了便于传输、存储和译码器进行译码，这样的组织的数据通常称为JPEG位数据流（JPEG bitstream）。8.2.4 算法举例图8-8是使用JPEG算法，对一个88像素的色差图像块，进行FDCT/量化和反量化/IDCT的计算结果。其中，在进行FDCT之前，先对源图像中的每个样本数据减去了128，在逆向离散余弦变换之后，又对重构图像中的每个样本数据加了128。图8-8 JPEG压缩算法举例8.3 JPEG文件格式JPEG在制定JPEG标准时，虽然定义了许多标记（marker）用来区分和识别图像数据及其相关

17、信息，但并没有具体定义明确的JPEG文件格式。C-Cube Microsystems公司的Eric Hamilton于1992.9.1所定义的JFIF（JPEG File Interchange Format，JPEG文件交换格式） 1.02成为JPEG文件（*.JPG）的事实标准。下面只介绍JPEG的基准模式（Baseline DCT）下的JFIF格式。8.3.1 图像准备在进行JPEG编码前，需要做的主要准备工作是分组元、颜色空间转换和88分块。1分组元灰度图：一个组元真彩图：三个组元 RGB等分辨率 YCbCr不等分辨率：4:2:2或4:1:2颜色空间转换JPEG文件使用的颜色空间是

18、1982年推荐的电视图像信号数字化标准CCIR 601（现改为ITU-R BT.601）。在这个彩色空间中，每个分量、每个像素的电平规定为256级，用8位代码表示。可使用前面介绍过的公式，在RGB空间与YCbCr空间之间相互转换：（1） RGBYCbCr Y = 0.299R + 0.587G + 0.114B Cb = -0.1687R 0.3313G + 0.5B +128 Cr = 0.5R 0.4187G 0.0813B + 128（2） YCbCrRGB R = Y + 1.402 * （Cr - 128） G = Y 0.34414 * （Cb 128） 0.71414 * （Cr

19、 - 128） B = Y +1.772 * （Cb - 128）3分块一般分成8*8的块，不足的部分补图像边缘的像素。8.3.2 文件格式框架JFIF格式的JPEG文件以开始，后跟含JFIF标识与版本号及图像参数的，接着是若干可选的存放商业公司信息或应用软件与扩展信息的；也是可选的和可多个的；对Baseline，一幅图象只有一个帧，所以只有一个描写具体图像参数的，而一帧只有一个记录Huffman表序号与频率分量信息的一个可包含若干Huffman表说明的是可选的；图像的压缩数据存放在一系列由若干8*8的数据块组成的MCU（Minimum Data Unit最小数据单元）中；文件最后以结束。即：

20、应用n标记段.量化表定义段.Huffman表定义段压缩数据8.3.3 文件格式内容注意：多字节无符号整数的高位字节在前，这与Intel CPU不同。图象开始标记（Start of Image marker）：0xff, SOI（0xd8）应用0标记段（APP0 marker segment）：应用0标记（APP0 marker）：0xff, APP0（0xe0）段长度（length）：2B（无符号整数，长度从本字段开始计算，下同）标识符（identifier）：5B：JFIF0 版本（version）：2B：主版本号（1B,=1）, 次版本号（1B,2）密度单位（unit）：1B（=0

21、：X与Y的密度表示X与Y的象素形状比，=1：点数/英寸，=2：点数/厘米） X方向象素密度（Xdensity）：2B（无符号整数） Y方向象素密度（Ydensity）：略图水平象素数（Xthumbnail）：1B 略图垂直象素数（Ythumbnail）：略图（thumbnail）：3*Xthumbnail*Ythumbnail B（若Xthumbnail=Ythumbnail=0 则无略图）应用n标记段（APPn marker segment）：（可选，可若干段）应用n标记（APPn marker）：0xff, APPn（0xen）（n=015）段内容（content）：（lengt

22、h-2）B量化表定义段（quantization table define segment）：定义量化表标记（Define Quantization Table marker）：0xff, DQT（0xdb）量化表说明（quantization table specification）：（可若干个，一般只一个）量化表精度与序号（precision and number of quantization table）：1B （精度Pm：高4位，=0（8b）, 1（16b）, Baseline=0; 序号Nm：低4位，=0,1,2,3）量化表（quantization table）：64*（

23、Pm+1） B（Z字形排序）帧参数段（frame parameters segment）：（对Baseline，一幅图象只有一个帧）帧开始标记（Start of Frame marker）：0xff, SOF0（0xc0）（Baseline DCT帧）数据精度（data precision）：1B（位数/象素/颜色分量，为输入数据的位数，Baseline=8）图象高（number of lines）：2B（无符号整数，光栅行数，不包含为得整数个MCU而对底边的复制行，若=0则行数由第一个扫描（scan）末尾的DNL标记（0xff, 0xdc）确定）图象宽（line length）：2B（无符号整数，光栅行内的象素数，不包含为得整数个MCU而对最右列的复制列）颜色分量说明

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？