ImageVerifierCode 换一换
格式:DOCX , 页数:27 ,大小:531.49KB ,
资源ID:5573024      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/5573024.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(哈夫曼压缩解压数据结构设计报告.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

哈夫曼压缩解压数据结构设计报告.docx

1、哈夫曼压缩解压数据结构设计报告数据结构课程设计数学与应用数学一班 胡耕岩 2012214147、问题分析和任务定义1.1设计任务采用哈夫曼编码思想实现文件的压缩和恢复功能 ,并提供压缩前后的占用空间之比。要求(1) 运行时的压缩原文件的规模应不小于 5K。(2) 提供恢复文件与原文件的相同性对比功能。1.2问题分析本课题是利用哈夫曼编码思想,设计对一个文本文件(.txt)中的字符进行 哈夫曼编码,生成编码压缩文件,并且还可将一个压缩后的文件进行解码还原 为原始文本文件(.txt )。在了解哈夫曼压缩解压缩原理之前,首先让我们来认识哈夫曼树。哈夫曼 树又称最优二叉树,是带权路径长度最小的二叉树。

2、在文本文件中多采用二进制编码。为了使文件尽可能的缩短,可以对文件 中每个字符出现的次数进行统计。设法让出现次数多的字符二进制码短些 ,而让那些很少出现的字符二进制码长一些。若对字符集进行不等长编码,则要求 字符集中任一字符的编码都不是其它字符编码的前缀 。为了确保哈夫曼编码的唯一性,我们可以对它的左右子树的大小给予比较限定 ,女口:左子树的权值小于右子树的权值。哈夫曼树中的左右分支各代表 0和,则从根节点到叶子节点所经历的路径分支的和1组成的字符串,为该节点对应字符的哈夫曼编码统计字符中每个字符在文件中出现的平均概率 (概率越大,要求编码越短)。利用哈夫曼树的特点:权越大的叶子离根越近,将每个

3、字符的概率值作 为权值,构造哈夫曼树。则概率越大的节点,路径越短。哈夫曼译码是从二进 制序列的头部开始,顺序匹配成共的部分替换成相应的字符,直至二进制转换 为字符序列。哈夫曼用于文件解压缩的基础是在压缩二进制代码的同时还必须存储相应 的编码,这样就可以根据存储的哈夫曼编码对压缩代码进行压缩 。总之,该课题的任务应该是首先要打开要压缩的文本文件并读出其字符出现的频率 ,以其为权值构建哈夫曼树。其次要找到构建压缩功能的方法,在构建哈夫曼树的基 础上进行编码,改变字符原先的存储结构,以达到压缩文件的目的,以外还有 存储相应的哈夫曼编码,为解压缩做准备。1.3测试用数据本实验的数据是通过读入一个名为

4、huffman.txt的文本文档,文档中内容为字符型数据。二、概要设计和数据结构的选择以下是在任务分析对题意的理解做出的概要设计和对数据结构的选择 :1、数据结构定义/huffman 树的结点结构体typedef struct HTnodelong weight; / 记录结点的权值int pare nt;/记录结点的双亲结点位置int lchild;/结点的左孩子int rchild;/结点的右孩子int *code;/记录该结点的huffman编码int codele n;/记录该结点huffman编码的长度/初始化结点,令其权值为无穷大,无双亲及左右孩子HT node()weight =

5、 MAX; pare nt = -1;Ichild = -1;rchild = -1;codele n = 0;HT node;2、定义huffman数类及其函数class huffma nTreepublic:huffma nTree();virtual huffma nTree();bool coun t(char *in put);void create(); /压缩时根据各结点的权值构造void code();void prin tcode(); / 列出每个字符的HTnode HTleaf*2-1; HTnode 结构的数组,用来表示huffman树,树的最大结点个数不会超过leaf

6、*2-1char byte; /压缩文件时用来缓冲 bit的变量int bits num; /byte 中 bit 的个数int lack num; / 压缩到最后byte中的bit不满8个时填充的0的个数;3、主程序的流程及模块间关系主函数实例化 huffmanTree 类,并实现菜单工具栏,通过用户的选择输入,用switch 语句进行分支执行 huffmanTree类中功能函数:1:压缩函数 bool compress(char *in put, char *output)2:恢复函数 bool decompress(char *in put, char *output)3:恢复文件与原文

7、件的对比函数 void compare2(char *in put, char *output)并可在完成相应功能后安全退出,压缩或恢复的文件在同文件夹下生成 。三、详细设计和编码核心算法-huffman 算法:(1)根据给定的n个权值 w1,w2, ,wn 构成n棵二叉树的集合F=T1,T2,汀n,其中每棵二叉树T1中只有一个带权的 w1的根据点,其左右子树均空。(2)在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根结点的权值为其左右树上根结点的权值之和 。(3)在F中删除这两棵树,同时将所得到的二叉树加入 F中。(4)重复(2) (3),直到F中只含一棵

8、树为止。这棵树便是Huffman树。Huffman树可用于构造代码总长度最短的编码方案 。为了详细说明这个问题,特以下面例子来说明:有四个叶子结点 A,B,C,D,分别带权为 9,4,5,2,可以构成许多种不同的带权二叉树 ,但各个带权二叉树的 WPL (树的带权路径长 度)不同,要想由n个带权叶子结点所构成的二叉树中 ,满二叉树或完全二叉树不一定是最优树。权值越大的结点离根越近的二叉树才是最优二叉树(huffman 树)。按照上面的算法,则可按照下面图的构造过程生成 huffman树。主程序模块:Huffman编码流程初始化节点构建哈夫曼树计算左右分支权值大 小,进行无重复前缀编YESNO主

9、函数Huffman解码流程以下是我在上机过程中遇到的一些问题及解决方案开始考虑问题是,要对文件进行压缩,如何才能达到比较好的效果,那就huffman编码是采用等长编码还是采用不等长问题 ,采用不登长编码要避免译码的二义性或多义性。假设用0表示字符D,用01表示字符C则当接受到编码串 “O1”并译到字符0时,是立即译出对应的字符 D,还是接着与下一个字符 1一起译为对应的字符 C,这就产生了二义性。因此,若对某一个字符集进行不等长编码,则要求字符集合中任何一个字符的 编码都不能是其他字符编码的前缀 。符合此要求的编码叫做前缀编码 。显然等长编码是前缀编码,这从等长编码所对应的编码二叉树也可以直接

10、看出 ,任何一个叶子结点都不可能是其它叶子结点的双亲,也就是说,只有当一个结点是另一个结点的双亲时 ,该结点的字符编码才会是另一个结点的字符编码的前缀 。为了使不等长编码为前缀编码,可用该字符集中的每个字符作为叶子结点生成一棵编 码二叉树,为了获得文件的最短长度 ,特将每个字符的出现频率作为字符结点的权值赋予该结点上,求出此树的最小带权路径长度就等于文件的最短长度 。因此,对文件进行压缩,就可以转化字符集中的所有字符作为叶子结点 ,字符出现的频率作为权值所产生的huffman树的问题。基本思路大致有了后,接下来是对程序的编写工作 ,程序初步形成后,对其测试,发现了一些语法错误,修正后编译通过。

11、运行程序如下图所示图5程序主菜单压缩:在命令行下输入1对文件进行压缩,根据提示输入刚刚建的文本文件 (huffman.txt),和要生成的压缩文件名称,按回车确认进行压缩。成功执行完毕后如下图所示图7压缩完毕恢复:在命令行下输入2对本程序压缩的文件进行恢复,根据提示输入待恢复的文件名称对比:在命令行下输入3对恢复后的文件和原文件对比 ,根据提示输入要对比的文件 ,按回车确认,成功执行后如下图所示。H:倖莹S计、哈夫晏压纯迅 co d e .huffm a nD?b u g .b jff-i a n哈夫曼编码压缩恢复算法压缩恢复4恢复文件与原文件的对比清屏退岀说明:请您输入相应的操作序号进行操作

12、图8文件恢复完毕五、测试结果程序功能满足设计要求,测试未发现明显bug ,详细可参见 五使用说明。程序如下:/ stdafx.h#in elude II#in elude II #in elude II using n amespaee std;输入输出头文件文件操作的类和方法队列容器const int leaf = 256;con st long MAX = 99999999;II最多可能出现的不同字符数II表示无穷大IIhuffman树的结点结构体typedef struct HTnodelong weight;II记录结点的权值int pare nt;II记录结点的双亲结点位置int l

13、child;II结点的左孩子int rchild;II结点的右孩子int *code;II记录该结点的huffman编码int codele n;II记录该结点huffman编码的长度II初始化结点,令其权值为无穷大,无双亲及左右孩子HTn ode()weight = MAX;pare nt = -1;lchild = -1;rchild = -1;codele n = 0;HT node;/ # ” #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #

14、f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f/ /tiTTiTiTiTiTiTiT7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiTiT / / II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II

15、 II II II II II II II II II II II II II II II II#/huffma nTree.h/huffman 树类class huffma nTreepublic:huffma nTree();virtual huffma nTree();bool coun t(char *in put);权值/压缩时统计各字符出现的次数,将其写入对应结点的void create();/压缩时根据各结点的权值构造 huffman树void code();huffman 编码/压缩时,利用建好的huffman树计算每个字符的void prin tcode();/列出每个字符的

16、huffman编码void addbit(int bit);/压缩时对一个未满 8个bit的byte中加入一个bitvoid resetbyte();/将byte清空bool compress(char *input, char *output); / 压缩函数 成功执行返回true 失败 falsebool decompress(char *in put, char *output); 恢复函数 成功执行返回true 失败 falsevoid compare(char *input, char *output); / 将原文件与压缩后的文件比较void compare2(char *inpu

17、t, char *output); / 将原文件与恢复后的文件比较private:int root;/记录根结点的位置int leafnum;/记录不同字符的个数HTn ode HTleaf*2-1;/HTnode结构的数组,用来表示huffman树,树的最大结点个数不会超过leaf*2-1char byte;/压缩文件时用来缓冲bit的变量int bits num;/byte中bit的个数int lack num;/压缩到最后byte中的bit不满8个时填充的0的个数专业.专注;/ # #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f

18、 #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f #f/ /tiTTiTiTiTiTiTiT7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiT7T7T7iiTiT / / II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II II

19、II II II II II II II II II II II II II II II II II II II II II II II II II II II II#/huffma nTree.cpp#i nclude stdafx.h#in elude huffma nTree.h/ Con structio n/Destructio n/ huffma nTree:huffma nTree()/初始化成员变量root = 0;leafnum = 0;byte = 0;bits num = 0;lack num = 0; huffma nTree:huffma nTree()for(i n

20、t i=0; ileaf; i+)if(HTi.codele n != 0)delete HTi.code;/统计各字符出现的次数bool huffma nTree:co un t(char *in put)ifstream ifs;char c;ifs.ope n(i nput,ios:b in ary);if(!ifs)cout 无法打开文件 i nput ! endl;return false;while(ifs.get(c)if(HTc+128.weight=MAX) / 若该字符是第一次出现HTc+128.weight = 0;leafnum+;HTc+128.weight+; /

21、权值 +1ifs.close();return true;/选权值最小的两棵树组成新的数void huffma nTree:create()for(int i=leaf; i2*leaf-1; i+)int loc1=-1, loc2=-1;for(i nt j=0; ji; j+)if(HT j.parent != -1)con ti nue;if(loc1=-1 | HT j.weight HTloc1.weight)loc2 = loc1;loc1 = j;else if(loc2=-1 | HTj.weight loc2 ? loc2 : loci;HTi.rchild = Ioc1l

22、oc2 ? loci : loc2;HTloc1.pare nt = i; HTloc2.pare nt = i;root = i;/列出每个字符的huffman编码void huffma nTree:pri ntcode()for(i nt i=0; ileaf; i+)if(HTi.codele n!=0)cout 值为 i-128 的字符的 huffman 编码:for(i nt j=0; jHTi.codele n; j+)cout HTi.codej;cout en dl;/压缩时,利用建好的huffman树计算每个字符的huffman编码void huffma nTree:code

23、()for(i nt i=0; i=0; j_) /从后往前找,记录结点的huffman编码if(loc=HTHTloc.pare nt.lchild)HTi.codej = 0;elseHTi.codej = 1;loc = HTloc.pare nt;/压缩时对一个未满 8个bit的byte中加入一个bitvoid huffma nTree:addbit(i nt bit)if(bit = 0)byte = byte 1; /若新增的bit为0,则直接将byte按位左移elsebyte = (byte 1) | 1); II若新增的bit为1,先将byte按位左移,再与1按位或运算bits

24、 nu m+;II将byte清空void huffma nTree:resetbyte()byte = 0;bits num = 0;/压缩函数成功执行返回true失败falsebool huffma nTree:compress(char *in put, char *output)if( !co un t(i nput)return false;create();code();ifstream ifs;ofstream ofs;ifs.ope n(i nput,ios:b in ary);ofs.ope n(o utput,ios:b in ary);char c;if(!ifs)cout

25、 无法打开文件 input ! endl;return false;if(!ofs)cout 无法打开文件 output ! endl;return false;ofs.put(0); /预留一个字符,等压缩完后在该位置写入不足一个 byte的bit个数ofs.put(root-384); /将根节点的位置-384写入(为使该值不超过char的最大表示范围)for(int i=0; ileaf*2-1; i+) /写入每个结点的双亲结点位置if(HTi.parent=-1) /若该节点没有双亲结点,贝U写入127( 一个字节所能表示的最大值)ofs.put(127);else /否则将双亲结点

26、的位置-384再写入(为使该值不超过char的最大表示范 围)ofs.put(HTi.pare nt-384);while(ifs.get(c) /将字符的huffman编码并加入byte中int tmp = c+128;for(i nt i=0; iHTtmp.codele n; i+)addbit(HTtmp.codei);if(bits num=8) /若byte已满8位,则输出该byte并将byte清空ofs.put(byte);resetbyte();if(bitsnum!=0) /处理最后未满8个字符的byte ,用0填充并记录填充的个数for(i nt i=bits num; i

27、8; i+)addbit(0);lack nu m+;ofs.put(byte);resetbyte();ofs.seekp(0,ios:beg); /将写指针移动到文件开头ofs.put(lacknum); /写入最后一个字节缺失的 bit个数ifs.close();ofs.close();return true;恢复函数成功执行返回true失败falsebool huffma nTree:decompress(char *in put, char *output)queue q;char c;ifstream ifs;ofstream ofs;ifs.ope n(i nput,ios:b in ary);ofs.ope n(o utput,ios:b in ary);if(!ifs)cout 无法打开文件 input

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1