北邮数据结构实验Huffman编码解码器.docx
《北邮数据结构实验Huffman编码解码器.docx》由会员分享,可在线阅读,更多相关《北邮数据结构实验Huffman编码解码器.docx(15页珍藏版)》请在冰豆网上搜索。
北邮数据结构实验Huffman编码解码器
数据结构
实
验
报
告
实验名称:
____Huffman编码/解码器_____
学生姓名:
__________________
班级:
__________________
班内序号:
__________________
学号:
__________________
日期:
___________________
1.实验要求
利用二叉树结构实现哈夫曼编/解码器。
基本要求:
1.初始化(Init):
能够对输入的任意长度的字符串s进行统计,统计每个字符的频度,并建立哈夫曼树
2.建立编码表(CreateTable):
利用已经建好的哈夫曼树进行编码,并将每个字符的编码输出。
3.编码(Encoding):
根据编码表对输入的字符串进行编码,并将编码后的字符串输出。
4.译码(Decoding):
利用已经建好的哈夫曼树对编码后的字符串进行译码,并输出译码结果。
5.计算输入的字符串编码前和编码后的长度,并进行分析,讨论赫夫曼编码的压缩效果。
2.程序分析
2.1存储结构
静态三叉链表
2.2程序流程(或程序结构、或类关系图等表明程序构成的内容,一般为流程图等)
2.2.1.流程图
输出各字符串编码
对哈弗曼码进行译码
输出译码结果
计算分析内存占用情况
输出占用情况
结束
2.2.1.伪代码
1.输入进行编码的字符串
2.遍历字符串,并为叶子节点权重赋值
3.依次对各字符进行哈弗曼编码,自下往上,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘1’。
4.显示各字符的哈弗曼编码。
5.对字符串进行编码,挨个遍历字符,找到相应的编码,复制到总的编码里,最后输出字符串的编码。
6.对字符串的哈弗曼码进行译码。
自上往下,若是‘0’,则递归到左孩子,若是‘1’,则递归到右孩子,知道叶子节点,输出该叶子节点代表字符,再继续遍历。
7.分析内存占用情况。
若用ASCII编码,每个字符占1个字节,即8bit,该情况下占用内存就是(字符长度)*8。
若用哈弗曼编码,占用内存是各(字符频度)*(每个字符占用位数)之和。
2.3关键算法分析
该程序关键算法即哈弗曼编码,语句如下:
voidCHTree:
:
huffmancode()
{
inti;
if(n<=1)return;
m=2*n-1;
for(i=1;i<=n;i++)//叶子节点的初始化
{ht[i].parent=0;
ht[i].lchild=0;
ht[i].rchild=0;}
for(;i<=m;i++)//非叶子节点的初始化
{
ht[i].weight=0;
ht[i].parent=0;
ht[i].lchild=0;
ht[i].rchild=0;}
for(i=n+1;i<=m;++i)//构造哈夫曼树
{
s1=select(i-1);//函数在ht[1]到ht[i-1]中选择parent为0且weight最小的结点,并将结点序号返s,并将ht[s1].parent设为-1
s2=select(i-1);
ht[s1].parent=i;
ht[s2].parent=i;
ht[i].lchild=s1;
ht[i].rchild=s2;
ht[i].weight=ht[s1].weight+ht[s2].weight;
}
intc,f;
for(i=1;i<=n;++i){
for(c=i,f=ht[i].parent;f!
=0;c=f,f=ht[f].parent)//逆向求叶子结点的哈夫曼编码
if(ht[f].lchild==c){
str[i].insert(0,"0",0,1);}//在字符串str[i]的第0位置插入字符“0”
else{
str[i].insert(0,"1",0,1);}//在字符串str[i]的第0位置插入字符“1”
}
}
分析:
这段语句实现的功能是根据统计出来的各字符的频度,建立哈弗曼。
建立哈弗曼树的过程如程序所展示,每次选取权重最小且无双亲节点的节点组合,并将其权重之和赋给其双亲节点,加入到总结中进行下次判断。
哈弗曼树建立完全以后,开始对各字符进行编码,从下往上,以叶子节点为起始点,若它是双亲节点的左孩子,其编码前插入‘0’,若是右孩子则插入‘1’。
再判断双亲节点使其双亲节点的左孩子还是右孩子,以此类推直到根节点。
依次对每个字符进行上述过程编码。
算法复杂度:
最好情况为只有根结点和叶子节点:
O(n)
最坏情况为满二叉树情况:
O(n*logn/2)
3.程序运行结果分析
首先,要求用户输入进行编码的字符串,遍历字符串,并为叶子节点权重赋值。
然后,依次对各字符进行哈弗曼编码,自下往上,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘1’。
屏幕上显示各字符的哈弗曼编码。
接下来对字符串进行编码,挨个遍历字符,找到相应的编码,复制到总的编码里,最后输出字符串的编码。
对字符串的哈弗曼码进行译码。
自上往下,若是‘0’,则递归到左孩子,若是‘1’,则递归到右孩子,知道叶子节点,输出该叶子节点代表字符,再继续遍历。
最后分析内存占用情况。
若用ASCII编码,每个字符占1个字节,即8bit,该情况下占用内存就是(字符长度)*8。
若用哈弗曼编码,占用内存是各(字符频度)*(每个字符占用位数)之和。
3.总结
4.1实验的难点和关键点
本实验的难点和关键点是进行哈弗曼的编码与译码。
编码之前先要遍历字符串,并统计各字符出现的频度。
这里就要区分目前的字符是否出现过,若出现过则字符权重加一,若没有出现则在结构体数组的当前末尾添加该元素。
统计完频度以后开始编码。
根据哈弗曼树的特点,每次选取结点里权重最小,且双亲不为0的节点结合,依次添加直至根节点。
编码过程是从下往上。
对于某字符所在叶子节点,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘1’。
直到双亲节点移动到根节点,所得到的编码即为该字符的编码。
译码过程是编码的逆过程。
依次读取哈弗曼码,自上往下,若是‘0’,则递归到左孩子,若是‘1’,则递归到右孩子,知道叶子节点,输出该叶子节点代表字符,再继续遍历。
4.2心得体会
通过哈弗曼树的程序编写,更加深入了解了树这种数据结构的特点,并且熟悉了这种数据结构的应用。
同时,也对哈弗曼编码的优越性能有了根本的解释。
附:
程序代码
#include
#include
usingnamespacestd;
#definemax1000//哈夫曼数存储的最大叶子节点数
intjudge;//初始化过程中用于判断字符是否出现过
structHTNode
{
charc;
intweight;
intlchild,rchild,parent;
};
classCHTree
{
public:
CHTree(){ht=NULL;};
voidInit();
voidhuffmancode();
intselect(inti);
voidDisplay();
voidcanculate();
voidencoding();
voiddecoding();
private:
HTNode*ht;
intm;
intn;//叶子结点数
ints1;
ints2;
stringa;//存储输入的字符串
stringcode;//存储对字符串的编码
stringstr[max];//存储叶子结点的哈夫曼编码
};
voidCHTree:
:
Init()
{
inti=1;//用于记录叶子节点个数
intj=0;
intx=0,ru;
cout<<"请输入进行编码的字符串:
"<cin>>a;
intl=a.length();
ht=(HTNode*)malloc((max)*sizeof(HTNode));//分配MAXSIZE个叶子结点的存储空间
while(x{
judge=1;
for(j=0;j
if(ht[j].c==a[x]){//如果字符a[x]已经出现过,则记录,权值加1
ht[j].weight++;
judge=0;
break;}
}
if(judge){//若字符没有出现过,字符入列,且权值设为1
n=i;//记录叶子节点数
ht[i].weight=1;
ht[i].c=a[x];
i++;}
x++;
}
}
intCHTree:
:
select(inti)//函数在ht[1]到ht[i]中选择parent为0且weight最小的结点,并将结点序号返回
{
intj=1;
intk=1;
ints;
while(ht[j].parent!
=0){
j++;
s=j;
}
k=j+1;
while(k<=i)
{
while(ht[k].parent!
=0)k++;
if(k>i)returns;
if(ht[j].weight>ht[k].weight){
ht[j].parent=0;//如果第二次和第二次以后循环中发现有比ht[j]权值还小的,将ht[j].parent重新设为0
j=k;//始终令“ht[j]”为二者中权值小的那一个
s=j;
ht[j].parent=-1;//如果ht[j]是权值较小的,将ht[j]的parent记为-1,
}
else{
s=j;
ht[j].parent=-1;}
k++;}
returns;}
voidCHTree:
:
huffmancode()
{
inti;
if(n<=1)return;
m=2*n-1;
for(i=1;i<=n;i++)//叶子节点的初始化
{ht[i].parent=0;
ht[i].lchild=0;
ht[i].rchild=0;}
for(;i<=m;i++)//非叶子节点的初始化
{
ht[i].weight=0;
ht[i].parent=0;
ht[i].lchild=0;
ht[i].rchild=0;}
for(i=n+1;i<=m;++i)//构造哈夫曼树
{
s1=select(i-1);//函数在ht[1]到ht[i-1]中选择parent为0且weight最小的结点,并将结点序号返s,并将ht[s1].parent设为-1
s2=select(i-1);
ht[s1].parent=i;
ht[s2].parent=i;
ht[i].lchild=s1;
ht[i].rchild=s2;
ht[i].weight=ht[s1].weight+ht[s2].weight;
}
intc,f;
for(i=1;i<=n;++i){
for(c=i,f=ht[i].parent;f!
=0;c=f,f=ht[f].parent)//逆向求叶子结点的哈夫曼编码
if(ht[f].lchild==c){
str[i].insert(0,"0",0,1);}//在字符串str[i]的第0位置插入字符“0”
else{
str[i].insert(0,"1",0,1);}//在字符串str[i]的第0位置插入字符“1”
}
}
voidCHTree:
:
Display(){
cout<<"huffman编码如下:
\n";
cout<<"字符"<<'\t'<<"权值"<<'\t'<<"哈夫曼编码"<for(inti=1;i<=n;i++){
cout<}
voidCHTree:
:
canculate(){
intm=0;
for(inti=1;i<=n;i++){
m+=(ht[i].weight)*(str[i].length());//该字符所占位数为频度和每个字符huffman码长度乘积
}
cout<<"\n\n内存分析:
\n"<<"原始编码所占内存数为"<<8*sizeof(char)*(a.length())<<"bit"<cout<<"huffman编码所占内存数为"<}
voidCHTree:
:
encoding(){
for(inti=0;ifor(intj=1;j<=n;j++){//循环变量j用于寻找huffman编码中与该字符的相匹配的字符编码
if(a[i]==ht[j].c)code+=str[j];
}
}
cout<<"\n\n字符编码为"<}
voidCHTree:
:
decoding(){
inti=0;
intm=code.length();
cout<<"\n\n对编码译码后所得字符:
";
while(iintparent=2*n-1;//根结点在HTree中的下表
while(ht[parent].rchild!
=0||ht[parent].lchild!
=0)//自根结点向叶子节点匹配编码,叶子节点左右孩子均为0,此时输出字符
{
if(code[i]=='0')
parent=ht[parent].lchild;
else
parent=ht[parent].rchild;
i++;
}
cout<}
}
voidmain()
{
CHTreeh;
h.Init();//初始化,统计输入字符的频度,赋值各叶子节点的权重
h.huffmancode();//建立huffman树
h.Display();//显示各字符对应的huffman码
h.encoding();//对输入的字符进行编码
h.decoding();//对以上编码进行解码
h.canculate();//计算分析编码前与编码后的所占内存
system("pause");
}