哈夫曼压缩解压数据结构设计报告.docx
《哈夫曼压缩解压数据结构设计报告.docx》由会员分享,可在线阅读,更多相关《哈夫曼压缩解压数据结构设计报告.docx(15页珍藏版)》请在冰豆网上搜索。
![哈夫曼压缩解压数据结构设计报告.docx](https://file1.bdocx.com/fileroot1/2022-12/31/13ce04c3-6847-4296-8f5b-b70c12aaad75/13ce04c3-6847-4296-8f5b-b70c12aaad751.gif)
哈夫曼压缩解压数据结构设计报告
《数据结构》
课程设计报告
设计题目:
哈夫曼编码压缩解压缩
学生姓名:
专业:
计算机科学与技术
班级:
学号:
指导老师:
完成日期:
合肥工业大学计算机与信息学院
一、问题分析和任务定义
设计任务
采用哈夫曼编码思想实现文件的压缩和恢复功能,并提供压缩前后的占用空间之比。
要求
(1)描述压缩基本符号的选择方法。
(2)运行时的压缩原文件的规模应不小于5K。
(3)提供恢复文件与原文件的相同性对比功能。
问题分析
本课题是利用哈夫曼编码思想,设计对一个文本文件(.txt)中的字符进行哈夫曼编码,生成编码压缩文件,并且还可将一个压缩后的文件进行解码还原为原始文本文件(.txt)。
在了解哈夫曼压缩解压缩原理之前,首先让我们来认识哈夫曼树。
哈夫曼树又称最优二叉树,是带权路径长度最小的二叉树。
在文本文件中多采用二进制编码。
为了使文件尽可能的缩短,可以对文件中每个字符出现的次数进行统计。
设法让出现次数多的字符二进制码短些,而让那些很少出现的字符二进制码长一些。
若对字符集进行不等长编码,则要求字符集中任一字符的编码都不是其它字符编码的前缀。
为了确保哈夫曼编码的唯一性,我们可以对它的左右子树的大小给予比较限定,如:
左子树的权值小于右子树的权值。
哈夫曼树中的左右分支各代表‘0’和‘1’,则从根节点到叶子节点所经历的路径分支的‘0’和‘1’组成的字符串,为该节点对应字符的哈夫曼编码。
统计字符中每个字符在文件中出现的平均概率(概率越大,要求编码越短)。
利用哈夫曼树的特点:
权越大的叶子离根越近,将每个字符的概率值作为权值,构造哈夫曼树。
则概率越大的节点,路径越短。
哈夫曼译码是从二进制序列的头部开始,顺序匹配成共的部分替换成相应的字符,直至二进制转换为字符序列。
哈夫曼用于文件解压缩的基础是在压缩二进制代码的同时还必须存储相应的编码,这样就可以根据存储的哈夫曼编码对压缩代码进行压缩。
总之,该课题的任务应该是首先要打开要压缩的文本文件并读出其字符出现的频率,以其为权值构建哈夫曼树。
其次要找到构建压缩功能的方法,在构建哈夫曼树的基础上进行编码,改变字符原先的存储结构,以达到压缩文件的目的,以外还有存储相应的哈夫曼编码,为解压缩做准备。
测试用数据
本实验的数据是通过读入一个名为的文本文档,文档中内容为字符型数据。
二、概要设计和数据结构的选择
以下是在任务分析对题意的理解做出的概要设计和对数据结构的选择:
1、数据结构定义
【1】
/C++程序设计(第2版)【M】.高等教育出版社,2009年9月
【2】郑莉等.c++语言程序设计(第三版)【M】.北京:
清华大学出版社,2003年12月
附录:
odelen!
=0)
delete[]HT[i].code;
}
}
eight==MAX){eight=0;
leafnum++;
}
HT[c+128].weight++;arent!
=-1)
continue;
if(loc1==-1||HT[j].weight{
loc2=loc1;
loc1=j;
}
elseif(loc2==-1||HT[j].weightloc2=j;
}
if(HT[loc1].weight==MAX||HT[loc2].weight==MAX||loc2==-1)eight=HT[loc1].weight+HT[loc2].weight;
child=loc1>loc2loc2:
loc1;
HT[i].rchild=loc1>loc2loc1:
loc2;
HT[loc1].parent=i;HT[loc2].parent=i;
root=i;
}
}
odelen!
=0){
cout<<"值为"<";
for(intj=0;j{
cout<}
cout<}
}
}
arent!
=-1)
{arent;
}
HT[i].codelen=len;
HT[i].code=newint[len];
loc=i;
for(intj=len-1;j>=0;j--)
{arent].lchild)
HT[i].code[j]=0;
else
HT[i].code[j]=1;
loc=HT[loc].parent;
}
}
}
arent==-1)arent-384);
}
while(c))
{odelen;i++)
{
addbit(HT[tmp].code[i]);
if(bitsnum==8)
{arent=c+384;
if(HT[c+384].lchild==-1)
HT[c+384].lchild=i;
else
HT[c+384].rchild=i;
}
}
intpoint=root;
child;
if(HT[point].lchild==-1&&HT[point].rchild==-1)
{
(char(point-128));
point=root;
}
c=c<<1;
}
else
{
point=HT[point].rchild;
if(HT[point].lchild==-1&&HT[point].rchild==-1)
{
(char(point-128));
point=root;
}
c=c<<1;
}
}
();
}
c=();child;
if(HT[point].lchild==-1&&HT[point].rchild==-1)
{
(char(point-128));
point=root;
}
c=c<<1;
}
else{
point=HT[point].rchild;
if(HT[point].lchild==-1&&HT[point].rchild==-1)
{
(char(point-128));
point=root;
}
c=c<<1;
}
}
();
();
();
returntrue;
}
//将原文件与压缩后的文件比较
voidhuffmanTree:
:
compare(char*input,char*output)
{
ifstreamorigin,compress;
(input,ios:
:
binary);
(output,ios:
:
binary);
if(!
origin)
{
cout<<"无法打开文件"<
'<return;
}
if(!
compress)
{
cout<<"无法打开文件"<