哈夫曼树编码译码实验报告Word格式.docx
《哈夫曼树编码译码实验报告Word格式.docx》由会员分享,可在线阅读,更多相关《哈夫曼树编码译码实验报告Word格式.docx(20页珍藏版)》请在冰豆网上搜索。
但在信息传递时,总希望总长度能尽可能短,即采用最短码。
假设每种字符在电文中出现的次数为Wi,编码长度为Li,电文中有n种字符,则电文编码总长度为∑WiLi。
若将此对应到二叉树上,Wi为叶结点的权,Li为根结点到叶结点的路径长度。
那么,∑WiLi恰好为二叉树上带权路径长度。
因此,设计电文总长最短的二进制前缀编码,就是以n种字符出现的频率作权,构造一棵哈夫曼树,此构造过程称为哈夫曼编码。
设计实现的功能:
(1)哈夫曼树的建立;
(2)哈夫曼编码的生成;
(3)编码文件的译码。
第三章概要设计
哈夫曼编\译码器的主要功能是先建立哈夫曼树,然后利用建好的哈夫曼树生成哈夫曼编码后进行译码。
在数据通信中,经常需要将传送的文字转换成由二进制字符0、1组成的二进制串,称之为编码。
构造一棵哈夫曼树,规定哈夫曼树中的左分之代表0,右分支代表1,则从根节点到每个叶子节点所经过的路径分支组成的0和1的序列便为该节点对应字符的编码,称之为哈夫曼编码。
最简单的二进制编码方式是等长编码。
若采用不等长编码,让出现频率高的字符具有较短的编码,让出现频率低的字符具有较长的编码,这样可能缩短传送电文的总长度。
哈夫曼树课用于构造使电文的编码总长最短的编码方案。
(1)其主要流程图如图1-1所示。
开始
结束
结点数是否大于1
将data和权值赋给ht
输出根结点和权值
调用SELECT函数
计算根结点函数
双亲结点为两子结点之和
输出两子结点和已构造的结点
是否为根结点?
左子是否为空?
此时编码为0
I<
2*N?
I++
编码为1
否
右子是否为空
是
(2)设计包含的几个方面:
①哈夫曼树的建立
哈夫曼树的建立由哈夫曼算法的定义可知,初始森林中共有n棵只含有根结点的二叉树。
算法的第二步是:
将当前森林中的两棵根结点权值最小的二叉树,合并成一棵新的二叉树;
每合并一次,森林中就减少一棵树,产生一个新结点。
显然要进行n-1次合并,所以共产生n-1个新结点,它们都是具有两个孩子的分支结点。
由此可知,最终求得的哈夫曼树中一共有2n-1个结点,其中n个结点是初始森林的n个孤立结点。
并且哈夫曼树中没有度数为1的分支结点。
我们可以利用一个大小为2n--1的一维数组来存储哈夫曼树中的结点。
②哈夫曼编码
要求电文的哈夫曼编码,必须先定义哈夫曼编码类型,根据设计要求和实际需要定义的类型如下:
typedetstruct{
charch;
//存放编码的字符
charbits[N+1];
//存放编码位串
intlen;
//编码的长度
}CodeNode;
//编码结构体类型
③代码文件的译码
译码的基本思想是:
读文件中编码,并与原先生成的哈夫曼编码表比较,遇到相等时,即取出其对应的字符存入一个新串中。
第四章详细设计
(1)①哈夫曼树的存储结构描述为:
#defineN50//叶子结点数
#defineM2*N-1//哈夫曼树中结点总数
typedefstruct{
intweight;
//叶子结点的权值
intlchild,rchild,parent;
//左右孩子及双亲指针
}HTNode;
//树中结点类型
typedefHTNodeHuffmanTree[M+1];
②哈弗曼树的算法
voidCreateHT(HTNodeht[],intn)//调用输入的数组ht[],和节点数n
{
inti,k,lnode,rnode;
intmin1,min2;
for(i=0;
i<
2*n-1;
i++)
ht[i].parent=ht[i].lchild=ht[i].rchild=-1;
//所有结点的相关域置初值-1
for(i=n;
i++)//构造哈夫曼树
{
min1=min2=32767;
//int的范围是-32768—32767
lnode=rnode=-1;
//lnode和rnode记录最小权值的两个结点位置
for(k=0;
k<
=i-1;
k++)
if(ht[k].parent==-1)//只在尚未构造二叉树的结点中查找
{
if(ht[k].weight<
min1)//若权值小于最小的左节点的权值
{
min2=min1;
rnode=lnode;
min1=ht[k].weight;
lnode=k;
}
elseif(ht[k].weight<
min2)
min2=ht[k].weight;
rnode=k;
}
}
ht[lnode].parent=i;
ht[rnode].parent=i;
//两个最小节点的父节点是i
ht[i].weight=ht[lnode].weight+ht[rnode].weight;
//两个最小节点的父节点权值为两个最小节点权值之和
ht[i].lchild=lnode;
ht[i].rchild=rnode;
//父节点的左节点和右节点
}
}
(2)哈弗曼编码
voidCreateHCode(HTNodeht[],HCodehcd[],intn)
inti,f,c;
HCodehc;
n;
i++)//根据哈夫曼树求哈夫曼编码
hc.start=n;
c=i;
f=ht[i].parent;
while(f!
=-1)//循序直到树根结点结束循环
if(ht[f].lchild==c)//处理左孩子结点
hc.cd[hc.start--]='
0'
;
else//处理右孩子结点
1'
c=f;
f=ht[f].parent;
hc.start++;
//start指向哈夫曼编码hc.cd[]中最开始字符
hcd[i]=hc;
voidDispHCode(HTNodeht[],HCodehcd[],intn)//输出哈夫曼编码的列表
inti,k;
printf("
输出哈夫曼编码:
\n"
);
i++)//输出data中的所有数据,即A-Z
%c:
\t"
ht[i].data);
for(k=hcd[i].start;
=n;
k++)//输出所有data中数据的编码
%c"
hcd[i].cd[k]);
voideditHCode(HTNodeht[],HCodehcd[],intn)//编码函数
charstring[MAXSIZE];
inti,j,k;
scanf("
%s"
string);
//把要进行编码的字符串存入string数组中
\n输出编码结果:
string[i]!
='
#'
i++)//#为终止标志
for(j=0;
j<
j++)
{
if(string[i]==ht[j].data)//循环查找与输入字符相同的编号,相同的就输出这个字符的编码
for(k=hcd[j].start;
hcd[j].cd[k]);
break;
//输出完成后跳出当前for循环
(3)哈弗曼译码
voiddeHCode(HTNodeht[],HCodehcd[],intn)//译码函数
charcode[MAXSIZE];
inti,j,l,k,m,x;
code);
//把要进行译码的字符串存入code数组中
while(code[0]!
)
i++)
m=0;
//m为想同编码个数的计数器
for(k=hcd[i].start,j=0;
k++,j++)//j为记录所存储这个字符的编码个数
if(code[j]==hcd[i].cd[k])//当有相同编码时m值加1
m++;
if(m==j)//当输入的字符串与所存储的编码字符串个数相等时则输出这个的data数据
printf("
for(x=0;
code[x-1]!
x++)//把已经使用过的code数组里的字符串删除
code[x]=code[x+j];
(4)主函数
voidmain()
intn=26,i;
charorz,back,flag=1;
charstr[]={'
A'
'
B'
C'
D'
E'
F'
G'
H'
I'
J'
K'
L'
M'
N'
O'
P'
Q'
R'
S'
T'
U'
V'
W'
X'
Y'
Z'
};
//初始化
intfnum[]={186,64,13,22,32,103,21,15,47,57,1,2,32,20,57,63,15,1,48,51,80,23,8,18,1,16};
HTNodeht[M];
//建立结构体
HCodehcd[N];
i++)//把初始化的数据存入ht结构体中
ht[i].data=str[i];
ht[i].weight=fnum[i];
while(flag)//菜单函数,当flag为0时跳出循环
(5)显示部分源程序:
********************************"
\n**1---------------显示编码**"
\n**2---------------进行编码**"
\n**3---------------进行译码**"
\n**4---------------退出**\n"
***********************************"
请输入选择的编号:
"
&
orz);
switch(orz)
case'
a'
:
system("
cls"
//清屏函数
CreateHT(ht,n);
CreateHCode(ht,hcd,n);
DispHCode(ht,hcd,n);
\n按任意键返回..."
getch();
break;
case'
b'
system("
printf("
请输入要进行编码的字符串(以#结束):
editHCode(ht,hcd,n);
c'
请输入编码(以#结束):
deHCode(ht,hcd,n);
d'
flag=0;
default:
}}}
第五章调试结果
进入主菜单
选A时的显示结果
选择B时的显示结果
选C时的显示结果
第六章心得体会
通过这次课程设计,让我对一个程序的数据结构有更全面更进一步的认识,根据不同的需求,采用不同的数据存储方式,不一定要用栈,二叉树等高级类型,有时用基本的一维数组,只要运用得当,也能达到相同的效果,甚至更佳,就如这次的课程设计,通过用for的多重循环,舍弃多余的循环,提高了程序的运行效率。
在编写这个程序的过程中,我复习了之前学的基本语法,哈弗曼树最小路径的求取,哈弗曼编码及译码的应用范围,程序结构算法等一系列的问题它使我对数据结构改变了看法。
在这次设计过程中,体现出自己单独设计模具的能力以及综合运用知识的能力,体会了学以致用、突出自己劳动成果的喜悦心情,也从中发现自己平时学习的不足和薄弱环节,从而加以弥补。
第七章参考文献
[1]徐孝凯编著,《数据结构课程实验》,清华大学出版2002年第一版
[2]张乃笑编著,《数据结构与算法》,电子工业出版社2004年10月
[3]严蔚敏《数据结构》(C语言版)清华大学出版社
附录:
源程序如下:
#include<
stdio.h>
stdlib.h>
//要用system函数要调用的头文件
#include<
conio.h>
//用getch()要调用的头文件
string.h>
#defineN50//义用N表示50叶节点数
#defineM2*N-1//用M表示节点总数当叶节点数位n时总节点数为2n-1
#defineMAXSIZE100
typedefstruct
chardata;
//结点值
intweight;
//权值
intparent;
//双亲结点
intlchild;
//左孩子结点
intrchild;
//右孩子结点
charcd[N];
//存放哈夫曼码
intstart;
//从start开始读cd中的哈夫曼码
}HCode;
intfnum