哈夫曼编码译码器系统.docx
《哈夫曼编码译码器系统.docx》由会员分享,可在线阅读,更多相关《哈夫曼编码译码器系统.docx(24页珍藏版)》请在冰豆网上搜索。
哈夫曼编码译码器系统
具体介绍:
在本课题中,我们在硬盘E盘中预先建立一个file1.txt文档,在里面编辑一篇文章(大写)。
然后运行程序,调用fileopen()函数读出该文章,显示在界面;再调用jsq()函数对该文章的字符种类进行统计,并对每个字符的出现次数进行统计,并且在界面上显示;然后以每个字符出现次数作为权值,调用ChuffmanTree()函数构建哈夫曼树;并调用print1()和print2()函数将哈夫曼的存储结构的初态和终态进行输出。
然后调用HuffmanEncoding()函数对哈夫曼树进行编码,调用coding()函数将编码写入文件;再调用decode()对编码进行译码,再输出至界面。
至此,整个工作就完成了。
测试数据:
例如从文本中读到文章为:
IAMASTUDENT。
则效果如下:
IAMASTUDENT
--------------------------------------
HuffmanTree的初态:
2000
1000
1000
1000
1000
1000
1000
2000
1000
-000
-000
-000
-000
-000
-000
-000
-000
--------------------------------------
字符A次数:
2
字符D次数:
1
字符E次数:
1
字符I次数:
1
字符M次数:
1
字符N次数:
1
字符S次数:
1
字符T次数:
2
字符U次数:
1
--------------------------------------
HuffmanTree的终态:
21300
11000
11000
11100
11100
11200
11200
21400
11300
21423
21545
21567
31691
416810
4171112
7171314
1101516
--------------------------------------
译码后的字符串:
IAMASTUDENT
**********************************************************
Pressanykeytocontinue
三维谷屋
3系统(项目)设计
(1)设计思路及方案
本课题是用最优二叉树即哈夫曼树来实现哈夫曼编码译码器的功能。
假设每种字符在电文中出现的次数为Wi,编码长度为Li,电文中有n种字符,则电文编码总长度为(W1*L1)+(W2*L2)+…+(Wi*Li)。
若将此对应到二叉树上,Wi为叶结点,Li为根结点到叶结点的路径长度。
那么,(W1*L1)+(W2*L2)+…+(Wi*Li)恰好为二叉树上带权路径长度。
三维谷屋
因此,设计电文总长最短的二进制前缀编码,就是以n种字符出现的频率作权,构造一棵哈夫曼树,此构造过程称为哈夫曼编码。
该系统将实现以下几大功能:
从硬盘读取字符串,建立哈夫曼树,输出哈夫曼树的存储结构的初态和终态,输出各种字符出现的次数以及哈夫曼编码的译码等。
(2)模块的设计及介绍
①从硬盘读取字符串
fileopen(参数)
{
实现命令;
打印输出;
}
②建立HuffmanTree
通过三个函数来实现:
voidselect(参数)
{
初始化;
for
{
接受命令;
处理命令;
}
}
说明:
在ht[1....k]中选择parent为0且权值最小的两个根结点的算法
intjsq(参数)
{
初始化;
for
{
接受命令;
处理命令;
}
}
说明:
统计字符串中各种字母的个数以及字符的种类
voidChuffmanTree()
{
初始化;
for
{
接受命令;
处理命令;
}
输出字符统计情况;
}
说明:
构造哈夫曼树
③输出哈夫曼树的存储结构的初态和终态
分别调用print1()和print2()来实现
voidprint1(参数)
{
初始化;
输出初态;
}
说明:
输出哈夫曼树的初态
voidprint2(参数)
{
for
{
输出终态;
}
}
说明:
输出哈夫曼树的终态
④哈夫曼编码和译码
voidHuffmanEncoding(参数)
{
定义变量;
{
处理命令;
}
}
说明:
哈夫曼编码
char*decode(参数)
{
定义变量;
while
{
接受命令;
处理命令;
}
}
说明:
哈夫曼译码
(3)主要模块程序流程图
下面介绍三个主要的程序模块流程图:
①主函数流程图:
图3.1
流程图注释:
该图比较简单,主要是调用各个函数模块,首先代开已经存在的文件,然后统计总的字符数以及出现的各个字符和频率。
然后才开始建立哈夫曼树,接着在哈夫曼树的基础上对其进行编码,编码之后才是译码。
最后输出结束。
②构造哈夫曼树:
图3.2
流程图注释:
该图是表示构造哈夫曼树的过程。
首先输入num个叶结点的权值,当i=num是循环结束。
然后进行哈夫曼树的构建,当i=2*num-1是循环结束。
最后输出所得到的字符统计情况。
三维谷屋返利
③哈夫曼编码:
图3.3
流程图解释:
该流程图表四哈夫曼编码情况。
首先初始化,Cd[--start]=0,start=num。
然后进行
编码,使用了一个三目运算符。
cd[--start]=(T[p].lchild==c)?
'0':
'1',即当cd[--start]=T[p].lchild==c时,cd[--start]=0;当cd[--start]=T[p].lchild!
==c时,cd[--start]=1。
这个编码循环一直到i=num时结束。
4系统实现
各模块关键代码及算法的解释:
1主调函数
代码解释:
这是main函数里的各个函数调用情况。
fileopen(string);//从硬盘中读取文件
num=jsq(string,cnt,str);//统计字符种类及各类字符出现的频率
DhuffmanTree(HT,cnt,str);
printf("HuffmanTree的初态:
\n");
print1(HT);//输出哈夫曼树的初态
ChuffmanTree(HT,HC,cnt,str);//建立哈夫曼树
HuffmanEncoding(HT,HC);//生成哈夫曼编码
printf("HuffmanTree的终态:
\n");
print2(HT);//输出哈夫曼树的终态
s=decode(HC);//读编码文件译码
printf("译码后的字符串:
\n");
printf("%s\n",s);//输出译码后的字符串
2建立HuffmanTree
代码解释:
该函数为在ht[1....k]中选择parent为0且权值最小的两个根结点的算法,其序号为s1和s2。
voidselect(HuffmanTreeT,intk,int&s1,int&s2)
{
inti,j;
intmin1=101;
for(i=1;i<=k;i++)
if(T[i].weight{
j=i;min1=T[i].weight;
}
s1=j;min1=32767;
for(i=1;i<=k;i++)
if(T[i].weight=s1)
{
j=i;min1=T[i].weight;
}
s2=j;
}
代码解释:
下面函数用来统计字符串中各种字母的个数以及字符的种类。
当字符在A和Z之间时即被计数,并用str[j]保存字母到数组中,用cnt[j]统计每种字符个数。
j返回总共读取的字符数目。
intjsq(char*s,intcnt[],charstr[])
{
inti,j,k;
char*p;
inttemp[27];
for(i=1;i<=26;i++)
temp[i]=0;
for(p=s;*p!
='\0';p++)
{
{
if(*p>='A'&&*p<='Z')
k=*p-64;
temp[k]++;
}
}//统计各种字符的个数
for(i=1,j=0;i<=26;++i)
if(temp[i]!
=0)
{
j++;
str[j]=i+64;//送对应的字母到数组中
cnt[j]=temp[i];//存入对应字母的权值
}
returnj;//j是输入字母总数
}
代码解释:
下面函数用来构造哈夫曼树HT。
首先初始化哈夫曼树,然后输入前面统计的各结点的权值,用for循环来构造哈夫曼树。
voidChuffmanTree(HuffmanTreeHT,HuffmanCodeHC,intcnt[],charstr[])
{
inti,s1,s2;
for(i=1;i<=2*num-1;i++)//初始化HT,2*num-1是指哈夫曼
//所有的结点数目
{
HT[i].lchild=0;HT[i].rchild=0;
HT[i].parent=0;HT[i].weight=0;
}
for(i=1;i<=num;i++)//输入num个叶结点的权值
HT[i].weight=cnt[i];
for(i=num+1;i<=2*num-1;i++)
{
select(HT,i-1,s1,s2);
HT[s1].parent=i;HT[s2].parent=i;
HT[i].lchild=s1;HT[i].rchild=s2;
HT[i].weight=HT[s1].weight+HT[s2].weight;
}
//在ht[1....k]中选择parent为0且权值最小
//的两个根结点,其序号为s1和s2,i为双亲
for(i=0;i<=num;i++)//输入字符集的中字符
HC[i].ch=str[i];//字符的种类
i=1;while(i<=num)
printf("字符%c次数:
%d\n",HC[i].ch,cnt[i++]);
}//输出统计的情况
3生成Huffman编码并写入文件
代码解释:
根据哈夫曼树T求哈夫曼编码H。
voidHuffmanEncoding(HuffmanTreeT,HuffmanCodeH)
{
intc,p,i;//c和p分别指示t中孩子和双亲
charcd[n];//临时存放编码串
intstart;//指示码在cd中的起始位置
cd[num]='\0';//最后一位(第num个)放上串结束符
for(i=1;i<=num;++i)
{
start=num;//初始位置