图像无损压缩算法综述.docx

资源描述

图像无损压缩算法综述.docx

《图像无损压缩算法综述.docx》由会员分享，可在线阅读，更多相关《图像无损压缩算法综述.docx（13页珍藏版）》请在冰豆网上搜索。

图像无损压缩算法综述.docx

图像无损压缩算法综述

【摘要】本文介绍了常见的图像无损压缩方法：

静态及动态霍夫曼（Huffman）编码算法、算术编码算法、LZW（lanpel-ziv-velch）编码及其改进算法、行程编码（又称游程编码，RLE）及改进自适应游程编码算法、费诺-香农编码算法和一种改进的编码方法。

简要分析了各种算法的优缺点。

【关键词】霍夫曼算术编码LZW行程编码费诺-香农编码

1前言

随着技术的不断发展，多媒体技术和通讯技术等对信息数据的存储和传输也提出了更高的要求，给现有的有限带宽带来更严峻的考验，尤其是具有庞大数据量的数字图像通信。

存储和传输的高难度极大地制约了图像通信的发展，因此对图像信息压缩技术的研究受到了越来越多的关注。

压缩数据量是图像压缩的首要目的，但保证压缩后图像的质量也是非常重要的，无损压缩是指能精确恢复原始图像数据的压缩方法，其在编码压缩过程中没有图像信号的损失。

本文介绍了常见的无损压缩方法：

2常见图像无损压缩算法

2.1霍夫曼算法

Huffman算法是一种用于数据压缩的算法，由D.A.Huffman最先提出。

它完全依据字符出现概率来构造平均长度最短的编码，有时称之为最佳编码，一般叫做Huffman编码。

频繁使用的数据用较短的代码代替，较少使用的数据用较长的代码代替，每个数据的代码各不相同。

这些代码都是二进制码，且码的长度是可变的。

2.1.1静态霍夫曼编码

步骤：

（1）将信号源的符号出现的概率（在此称为权值）{w1，w2，...，wn}构造成n棵二叉树集合F={T1，T2，...，Tn}，其中每棵二叉树Ti中只有一个带权为wi的根结点，其左右子树均为空。

（2）在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树，且置新的二叉树的根结点的权值为其左、右子树上根结点的权值之和

（3）在F中删除这两棵树，同时将新得到的二叉树加入F中。

（4）重复

（2）和（3），直到F只含一棵树为止，这棵树便是霍夫曼（Huffman）树。

（5）在合并中约定权值小的根结点在左子树上，权值大的在右子树上，然后在每个左分支上标记为“0”，右分支上标记为“1”，最后记录从霍夫曼（Huffman）树的根结点到每个叶子结点所经过的分支上的“0”或“1”的序列，从而得到每个符号的Huffman编码。

2.1.2自适应霍夫曼编码

这种方案在不需要事先构造Huffman树，而是随着编码的进行，逐步构造Huffman树。

同时，这种编码方案对符号的统计也动态进行，随着编码的进行，同一个符号的编码可能发生改变（变得更长或更短）。

在构造动态霍夫曼编码树的过程中，需要遵循两条重要原则：

（1）权重值大的节点，节点编号也较大。

（2）父节点的节点编号总是大于子节点的节点编号。

以上两点称为兄弟属性（sibling property）。

在每一次调整节点权重值时，都需要相应的调整节点编号，以避免兄弟属性被破坏。

在对某一个节点权重值进行“加一操作”时，应该首先检查该节点是否具有所在的块中的最大节点编号，如果不是，则应该将该节点与所在块中具有最大节点编号的节点交换位置。

然后再对节点的权重值加。

这样，由于该节点的节点编号已经处于原来所属块中的最大值，因此权重值加一之后兄弟属性仍然得到满足。

最后，由于节点的权重发生了变化，必须递归地对节点的父节点进行加一操作。

在需要插入一个新符号时，总是先构造一个新的子树，子树包含NYT符号与新符号两个叶节点，然后将旧的NYT节点由这个子树替代。

由于包含NYT符号的节点权重值为0，而包含新符号的叶节点的权重值为1，因此最终效果相当于原NYT节点位置的权重值由0变为1。

因此，下一步将试图对其父节点执行权重值“加一操作”。

对符号编码的方法与静态霍夫曼编码一致，每次符号编码完成以后，也将对包含符号的节点权值进行加一操作。

将一个新的符号插入编码树或者输出某一个已编码符号后，相应的符号的出现次数增加了1，继而编码树中各种符号的出现频率发生了改变，不一定符合兄弟属性，按照上述方法进行调整，使其符合要求。

2.2算术编码算法

算术编码完全抛弃了用特殊字符代替输入字符的思想。

在算术编码中，输入的字符信息用0到1之间的数字进行编码，它用到两个基本的参数:

符号的频

率及其编码间隔。

对于输入的字符信息，算术编码后形成一个唯一的浮点数。

算术编码的效率一般要优于哈夫曼编码，但实现要比哈夫曼编码复杂。

2.2.1算术编码原理

图1算术编码流程图

固定模式编码需要预先对符号序列中的符号进行预扫描，根据统计符号的概率来列出编码概率表。

引入几个变量：

low为编码间隔的低端，rang为编码间隔的长度,ranglow为编码字符的间隔的低端,ranghigh为编码字符的间隔的高端。

在固定模式编码中，ranglow和ranghigh的编码概率不变。

计算流程如图1。

用例子说明算术编码编解码原理，采用固定模式符号概率分配表见表1。

若要编码字符串’eai’，则编码过程如图2。

表1算术编码字符概率分配表图2算术编码示意图

2.2.2算术编码解码原理

LZW编码是一种基于字典模型的无损数据压缩方法，由Lempel-Ziv-Welch共同提出。

通过建立一个字符字典，用较短的码字表示较长的字符串，达到数

据压缩的目的。

在动态的建立字典的同时，字符串和码字之间逐渐建立关系。

后续的字符串与字典进行比较，不断完善和壮大字典。

生成的字典不需要随着数据一块存储和传输，在解压缩的过程中仍然能够重建一个完全相同的字典，从而进一步地提高压缩效率。

在介绍LZW编码流程之前，首先定义几个在LZW编码、解码过程中出现的概念:

当前前缀，表示在编码算法中正在被处理的前缀

当前字符，表示在编码算法中当前确定的字符。

cW:

当前码字，当前被处理字符串对应的码字。

pW:

先前码字，先前被处理字符串对应的码字。

String.cW:

当前码字对应的字符串。

String.pW:

先前码字对应的字符串。

LZW编码过程:

建立初始字典，该初始字典中包含待处理字符数据流中所有可能出现的字符。

同时，设置前缀P为空；读取字符串数据流中的下一个字符作为当前字符，送至C中；判断P+C是否已经存在字典之中，若存在:

P=P+C，用C来扩展P，若不存在：

把表示前缀P的码字cW输出到编码数据流中。

将字符串P+C按照顺序加入字典中，同时使P=C；判断字符数据流是否编码完毕，若编码完毕:

编码完成，输出P所对应的码字cW到编码数据流结尾处，若未完成，则继续编码。

图4LZW编码流程图

LZW译码过程:

建立初始字典，该初始字典中包含待处理字符数据流中所有可能出现的字符。

读取编码数据流中的第一个码字cW。

输出cW所对应的字符串String.cW到字符数据流中。

pW=cW，读入编码数据流中的下一个码字cW。

判断cW对应的字符串String.cW是否在字典中?

若在字典中:

将String.cW输出到字符数据流，P=String.pW，C=String.pW字符串中的第一个字符，P+C添加到字典；若不在字典中:

P=String.pW，C=String.cW中的第一个字符，输出P+C到字符数据流，然后将P+C添加至字典。

判断码字流中是否还有待译码字?

是:

返回步骤pW=cW；否:

译码结束。

图5LZW解码流程图

2.3.2改进的LZW编码

LZW压缩算法的执行速度依赖于字典查找的速度。

在LZW压缩算法中，若直接检索字典，编码的速度很低，同时时间复杂度较高，为O（n2）。

因此，选择一种效率较高的字典存储和遍历索引的方式是提高LZW编码效率的主要途径。

为了提高字典的存储和索引效率，引入散列表（HashTable）来存储字典，只需通过关键字就可以确定结点的存储位置，这样能有效提高字符串表的检索效率。

为了提高编码的效率，采用可变长度的编码方法。

在系统中，使用的可变编码位数从8位开始，当编码长度超过了8位的表示范围，则自动增加到9位编码，依次递增编码位数。

但增加编码位数使得算法性能和执行效率都受到影响，因此，设定编码长度的最大范围为12位，当编码超出12位（4096）表示范围，需要重新开始字典的生成和编码。

当词条数目过多导致字典容量饱和时，需要重新生成字典，clear操作会严重影响压缩编码的压缩比和执行效率，因此，为了解决传统的LZW编码压缩效率低的问题，现作出以下改进:

当字典中串表填满之后，不立即输出clear信号，删除字典表，而是继续输入一定长度的数据流，使用现有的字典表表对其进行压缩编码，同时计算出这时被压缩的数据流的压缩比，如果所得到的压缩比较低，满足系统要求即

（其中

为当前计算的压缩比，

为系统给定的一个阀值），则继续先前的操作;如果所得到的压缩比

时，表示现在的字典表无法满足当前数据压缩的要求，则进行删除和重建字典表的操作。

这样可以有效抑制那些突发的数据对整体压缩性能的影响，使得系统不会由于一些数据毛刺的影响导致多次删除和重建字典表，提高了LZW压缩算法的压缩比和执行效率。

改进的LZW编码算法的软件流程图如下图6所示：

图6改进的LZW算法实现流程图

可以通过流程图看出，改进的LZW编码方式主要在添加新词条字符串时，需要判断码长是否满足要求，同时当系统码长达到最大，即12位码长之后，是否输出clear信号需要通过判断一段数据流的压缩比后决定。

2.4游程编码算法

行程编码RLE又称游程编码，这种压缩方法广泛的应用于各种图像格式的数据压缩处理中，是压缩图像最简单的方法之一。

2.4.1传统游程编码

游程编码技术是在给定的图像数据中寻找连续重复的数值，然后用两个字符取代这些连续值。

传统的游程编码是由两个元素的序对组成，其中表示编码符号，表示游程长度，等于有相同编码符号的相同元素的数目。

这种方法在处理包含大量重复信息的数据时可以获得很好的压缩效率。

但是如果连续重复的数据很少，则难获得较好的压缩比，甚至可能会导致压缩后的编码字节数大于处理前的图像字节数。

2.4.2改进自适应游程编码算法

固定格式的常规游程编码与实际游程长度的适应能力差。

因此，需要一种灵活的游程编码方式：

遇到短游程用较短的字长描述，遇到长游程时自动用较长的码子描述。

从二进制的表达方式可以得到启发：

二进制计数方法的实质是对不同位置的

比特分配不同的权重，而这些权重的分配能够描述任何一个整数。

因此，最为理想的游程编码的

的字长应当等于游程的实际长度对应的二进制数的比特总数。

但是游程的实际长度是随机的，因此解码器无法确切知道当前

的字长是多少。

为此提出一种改进的游程编码算法。

仍然采用两个元素的序对

组成，其中

等于原始码流长度对应的二进制数的比特，

表示

对应比特数的长度。

设定一个游程指针（简称游针）和两个码表（O码表和1码表）。

0码表适合对连0编码，1码表适合对连l编码。

由统计特性知，连0远远大于连1，对于0码表来说，

往往比较长，因此

也相应比较大，考虑最大连0，把

取为4位。

而对于1码表来说，

比较短，因此

也相应比较小，考虑最大连1，把

取为3位。

首先根据游针探测输入码元极性，判断是采用0码表还是1码表。

选中码表后，游针通过计数器方式探测连续码流，得到连续码流长度n；然后将码流长度转化为二进制码，得到

同时计算

的长度，并转化为二进制码得到

；设原始码长为

，则

。

转化为二进制可以采用如下运算：

依次把

就得到

，同理可得到

。

最后合并

，得到最终编码。

2.5费诺-香农编码算法

由于霍夫曼编码法需要多次排序，当元素很多时不方便，为此费诺和香农分别单独提出类似的方法，使编码方法更简单。

具体编码方法如下：

（1）把

按概率由大到小，从上到下排成一列，然后把

分成两组

和

并使得：

（2）给两组中的

赋值，将概率大的一组赋为0，概率小的一组赋为1。

这是该方法的赋值原则。

（3）把两组分别按

（1）、

（2）分组赋值，不断重复，直到每组只有一种输入元素为止。

将每个

所赋的值依次排列起来就是费诺-香农编码。

2.6一种新的无损图像压缩算法

本方法是一种新的二进制（位级）无损图像压缩方法——将错误纠正BCH码引入到图像压缩算法中；将图像的二进制分为大小为7的码字，这些块进入到BCH解码器，消除了校验位后，使得原来的块的大小减少到4位。

BCH编码方式是将大小为K位的块，通过增加m位的校验位，形成—个长度为n的码字。

在本方法中，我们将n的大小定义为7。

这个值被选中后进行多次实验，得到较好的结果。

图7示出了BCH算法系统的框架。

图7BCH算法系统构造图

2.6.1压缩步骤

第一步：

预处理步骤，将图像转换成二进制数字图像。

第二步：

使用（7，4）BCH码解码器，将这些二进制数转换成一个由4位数据产生的长度为7的块。

请注意，并非所有的长度为7位的块都是码字，也有长度为7的块是非编码字。

因此，我们使用—个额外的位来区分码字和非码字。

第三步：

生成二进制数的Huffman编码压缩图像文件。

第四步：

添加位文件应用两种不同的算法：

执行长度编码（RLE）算法嘲和哈夫曼编码算法。

然后，将该文件添加到压缩的二进制文件中。

图8为该方法的流程图。

图8算法流程图

2.6.2解压步骤

第一步：

读压缩文件的标题，并从中提取补充位文件，然后通过应用哈夫曼解码器解码提取的文件，申请的RLE解码器，以增加位的方式使得文件返回其原来的形式。

第二步：

对使用哈夫曼算法压缩的图像文件进行解码。

第三步：

使用BCH编码。

在这个过程中，将读取文件的所有位的信息。

添加位的值决定了当前块K的大小，如果添加位当前的值是1，那么块的大小是4位，否则块的大小是7位。

BCH编码器返回的块大小为4位到7位的原始大小，并返回

BCH解码删除奇偶位。

第四步：

图像没有任何数据丢失返回其原始状态。

3常见无损压缩算法的总结

本文介绍了常见的无损压缩方法：

静态及动态霍夫曼（Huf}nan）编码算法、算术编码算法、LZW（lanpel-ziv-velch）编码及其改进算法、行程编码（又称游程编码，RLE）及改进自适应游程编码算法、费诺-香农编码算法和一种改进的编码方法。

3.1Huffman编码算法分析

Huffman的编码方法充分利用了短码，编码效率比较高，且对编码设备的要求也比较简单，是综合性能较高的一种编码方法。

但是，它也存在工作量大、编解码时问较长等缺陷，给实际应用带来很大困难。

自适应霍夫曼编码方案在不需要对数据扫描两遍，而是随着编码的进行，逐步构造Huffman树。

同时，这种编码方案对符号的统计也动态进行，随着编码的进行，同一个符号的编码可能发生改变。

3.2算术编码算法分析

算术编码完全抛弃了用特殊字符代替输入字符的思想。

在算术编码中，输入的字符信息用0到1之间的数字进行编码，它用到两个基本的参数:

符号的频率及其编码间隔。

对于输入的字符信息，算术编码后形成一个唯一的浮点数。

算术编码的效率一般要优于哈夫曼编码，但实现要比哈夫曼编码复杂。

算术编码能最大限度地减小信息的冗余度，与Huffman编码方法相比，在同样的计算机系统上，算术编码可以得到更好的压缩效果，但却要消耗也许几十倍的计算时间，因此无法成为日常使用的压缩方法。

3.3LZW编码算法分析

LZW编码属于字典编码，其原理是利用字典把每个字符串编码为一个标识，利用查字典的方法找出重复出现的字符串，以标识来代替字符串，从而达到压缩的目的。

LZW编码实现的基本思想是：

读取字符串；如果在字典中找到匹配，那么用字典地址代替该字符串，并继续下一个查找，直到查找不到，则把未查找的字符串加入字典；读入下一个字符，循环上述过程，直到结束。

LZW压缩算法也存在着一些不足之处，故讨论一种改进的LZW编码数据压缩算法，对传统LZW编码数据压缩算法进行了改进，将字典初始化为16位，采用散列法和拉链法进行词条检索，采用阈值判断和LRU淘汰机制改进条目更新的方式，编码时采用自适应变码长方式。

相比于传统LZW编码数据压缩算法，改进的算法对不同码长的数据的适应性更好，并且压缩比提高了约8%。

3.4游程编码算法分析

游程编码（run-lengthencoding）是把一串连续的重复值（如图像的像素值）用一个单独的值和一个计数值来取代。

对有大面积的连续阴影或者颜色相同子块的图像，使用这种方法实现简单，压缩效果很好。

传统的游程编码方法，往往导致较短游程的编码位数大于较短游程长度的自然位数，当二元序列中较短游程较多时，较短游程重新编码所导致的数据膨胀会严重影响二元序列的压缩效能。

自适应游程编码是一种对小波域经数学形态学处理得到的小波显著系数的有效编码方式。

图像小波分解。

经数学形态学膨胀处理后，位平面将出现大量极长的连“0”，利用游程编码将是非常有效的。

改进的自适应游程编码算法最突出的新特点是其可以将原始比特流转换成码长的二进制编码。

实验结果表明，当连续码流相等的情况下，改进的算法可以有效减少编码长度。

3.5费诺-香农编码算法分析

费诺-香农编码算法与霍夫曼编码有类似之处，但霍夫曼编码法需要多次排序，当元素很多时不方便，费诺-香农编码算法使编码方法更简单。

3.6新的无损压缩算法分析

本文中，详细介绍了一种新的无损图像压缩方案。

新的二进制（位级）无损图像压缩方法——将错误纠正BcH码引入到图像压缩算法中；将图像的二进制分为大小为7的码字，这些块进入到BCH解码器，消除了校验位后，使得原来的块的大小减少到4位。

实验结果表明，此压缩算法是有效的，并给出了一个很好的压缩比，而且不丢失数据。

BCH码的使用在提高压缩比方面比单纯霍夫曼压缩的结果要好。

4参考文献

[1]蔡明,乔文孝,鞠晓东,车小花,卢俊强,贾安学.一种新的数据无损压缩编码方法[J].电子与信息学报,2014,04:

1008-1012.

[2]尤晶晶,王韶霞.浅谈优化图像压缩的算法技术实现[J].河北民族师范学院学报,2014,02:

30-32.

[3]谢耀华,汤晓安,孙茂印,张永亮.基于分类重排LZW的图像无损压缩算法[J].中国图象图形学报,2010,02:

236-241.

[4]冯希.几种图像无损压缩与编码方法的比较研究[D].中国科学院研究生院（西安光学精密机械研究所）,2008.

[5]宋秉玺.高效无损压缩算法的研究与实现[D].西安电子科技大学,2014.

[6]王敏超,王敏莉,李秋生,张诚鎏.无损自适应分布式算术编码的研究及应用[J].计算机工程与设计,2011,10:

3470-3476.

[7]张炜琳,尹聪敏.浅谈算术编码的编解码过程[J].民营科技,2013,08:

[8]安向明,张丹,邹红.基于上下文自适应算术编码的设计与实现[J].电脑学习,2009,03:

107-108.

[9]彭勇.一种改进的LZW编码数据压缩算法的设计与仿真[J].信息与电脑（理论版）,2012,02:

55-56.

[10]向涛,王安.安全的LZW编码算法及其在GIF图像加密中的应用[J].计算机应用,2012,12:

3462-3465.

[11]马士强,郑常宝,曾野,杜杰成.基于信号周期相似性和LZW编码的数据压缩方法[J].电测与仪表,2014,06:

95-100.

[12]高健,陈耀,刘旦.数据多次分组的图像无损压缩算法[J].计算机系统应用,2010,12:

64-68.

[13]杜时英.一种新的无损图像压缩算法的研究[J].计算机时代，2012,（8）:

24-25.

[14]朱贵富,齐婷,刘春华等.图像无损压缩技术分析与性能比较[J].计算机与网络,2010,36（6）:

50-52.

展开阅读全文