哈夫曼压缩解压数据结构设计报告Word文件下载.docx
《哈夫曼压缩解压数据结构设计报告Word文件下载.docx》由会员分享,可在线阅读,更多相关《哈夫曼压缩解压数据结构设计报告Word文件下载.docx(15页珍藏版)》请在冰豆网上搜索。
在文本文件中多采用二进制编码。
为了使文件尽可能的缩短,可以对文件中每个字符出现的次数进行统计。
设法让出现次数多的字符二进制码短些,而让那些很少出现的字符二进制码长一些。
若对字符集进行不等长编码,则要求字符集中任一字符的编码都不是其它字符编码的前缀。
为了确保哈夫曼编码的唯一性,我们可以对它的左右子树的大小给予比较限定,如:
左子树的权值小于右子树的权值。
哈夫曼树中的左右分支各代表‘0’和‘1’,则从根节点到叶子节点所经历的路径分支的‘0’和‘1’组成的字符串,为该节点对应字符的哈夫曼编码。
统计字符中每个字符在文件中出现的平均概率(概率越大,要求编码越短)。
利用哈夫曼树的特点:
权越大的叶子离根越近,将每个字符的概率值作为权值,构造哈夫曼树。
则概率越大的节点,路径越短。
哈夫曼译码是从二进制序列的头部开始,顺序匹配成共的部分替换成相应的字符,直至二进制转换为字符序列。
哈夫曼用于文件解压缩的基础是在压缩二进制代码的同时还必须存储相应的编码,这样就可以根据存储的哈夫曼编码对压缩代码进行压缩。
总之,该课题的任务应该是首先要打开要压缩的文本文件并读出其字符出现的频率,以其为权值构建哈夫曼树。
其次要找到构建压缩功能的方法,在构建哈夫曼树的基础上进行编码,改变字符原先的存储结构,以达到压缩文件的目的,以外还有存储相应的哈夫曼编码,为解压缩做准备。
测试用数据
本实验的数据是通过读入一个名为的文本文档,文档中内容为字符型数据。
二、概要设计和数据结构的选择
以下是在任务分析对题意的理解做出的概要设计和对数据结构的选择:
1、数据结构定义
【1】
/C++程序设计(第2版)
【M】.高等教育出版社,2009年9月
【2】郑莉等.c++语言程序设计(第三版)
【M】.北京:
清华大学出版社,2003年12月
附录:
odelen!
=0)
delete[]HT[i].code;
}
}
eight==MAX){eight=0;
leafnum++;
}
HT[c+128].weight++;
arent!
=-1)
continue;
if(loc1==-1||HT[j].weight<
HT[loc1].weight)
{
loc2=loc1;
loc1=j;
}
elseif(loc2==-1||HT[j].weight<
HT[loc2].weight)
loc2=j;
if(HT[loc1].weight==MAX||HT[loc2].weight==MAX||loc2==-1)eight=HT[loc1].weight+HT[loc2].weight;
child=loc1>
loc2loc2:
loc1;
HT[i].rchild=loc1>
loc2loc1:
loc2;
HT[loc1].parent=i;
HT[loc2].parent=i;
root=i;
odelen!
=0){
cout<
<
"
值为"
<
i-128<
的字符的huffman编码:
"
;
for(intj=0;
j<
HT[i].codelen;
j++)
cout<
HT[i].code[j];
endl;
arent!
=-1)
{arent;
HT[i].codelen=len;
HT[i].code=newint[len];
loc=i;
for(intj=len-1;
j>
=0;
j--)
{arent].lchild)
HT[i].code[j]=0;
else
HT[i].code[j]=1;
loc=HT[loc].parent;
arent==-1)arent-384);
while(c))
{odelen;
i++)
{
addbit(HT[tmp].code[i]);
if(bitsnum==8)
{arent=c+384;
if(HT[c+384].lchild==-1)
HT[c+384].lchild=i;
HT[c+384].rchild=i;
intpoint=root;
child;
if(HT[point].lchild==-1&
&
HT[point].rchild==-1)
{
(char(point-128));
point=root;
}
c=c<
1;
point=HT[point].rchild;
();
c=();
child;
if(HT[point].lchild==-1&
(char(point-128));
point=root;
c=c<
else{
point=HT[point].rchild;
();
returntrue;
//将原文件与压缩后的文件比较
voidhuffmanTree:
:
compare(char*input,char*output)
{
ifstreamorigin,compress;
(input,ios:
binary);
(output,ios:
if(!
origin)
{
cout<
无法打开文件"
input<
'
!
'
return;
compress)
output<
}
doubletotal1=0,total2=0;
charc;
total1++;
total2++;
cout<
原文件大小:
total1<
Byte"
压缩后大小:
total2<
压缩率:
total2/total1*100<
%'
//将原文件与恢复后的文件比较
compare2(char*input,char*output)
ifstreamorigin,decompress;
charc1,c2;
booldif=false;
while(c1)&
(c2))
if(c1!
=c2)//依次比较每个字节,不同则将dif标志设为true
dif=true;
while(c1))
{//若原文件还有剩余的数据,将dif设为true
dif=true;
while(c2))
{//若恢复文件还有剩余的数据,将dif设为true
恢复文件大小:
if(dif==true)
原文件与恢复文件不同!
else
原文件与恢复文件相同!
//##############################################################
//
#include"
voidmain()
intchoice=1;
charinput[255],output[255];
huffmanTreeh;
while(choice)
cout<
***************************************************"
endl;
*哈夫曼编码压缩恢复算法*"
**"
*1)压缩*"
*2)恢复*"
**"
*3)恢复文件与原文件的对比*"
*4)清屏*"
*5)退出*"
*说明:
请您输入相应的操作序号进行操作*"
****************************************************"
>
cin>
choice;
switch(choice)
case1:
请输入待压缩的文件名:
cin>
input;
请输入压缩后的文件名:
output;
if((input,output))
();
(input,output);
cout<
endl<
文件压缩成功!
}else
文件压缩失败!
break;
case2:
请输入待恢复的文件名:
请输入恢复后的文件名:
if(input,output))
文件恢复成功!
else
文件恢复失败!
case3:
请输入原文件的文件名:
请输入恢复文件的文件名:
(input,output);
case4:
//执行清屏命令
system("
cls"
);
case5:
default:
参数错误!
请重新输入"