数据结构课程设计哈夫曼编码Word文档下载推荐.docx
《数据结构课程设计哈夫曼编码Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《数据结构课程设计哈夫曼编码Word文档下载推荐.docx(21页珍藏版)》请在冰豆网上搜索。
试为这样的信息收发站写一个哈夫曼码的编译码系统。
具体要求:
1)初始化:
键盘输入字符集大小n及n个字符和m个权值,建立哈夫曼树,并将它存于文件hfmtree中。
2)编码:
利用建好的哈夫曼树,对文件tobetrans中的正文进行编码,然后将结果存入文件codefile中。
3)解码:
利用建好的哈夫曼树将文件codefile中的代码进行译码,结果存入文件textfile中。
4)打印代码文件:
将文件codefile以紧凑格式显示在终端上,每行50个代码。
同时将此字符形式的编码文件写入文件codeprint中。
5)*
6)打印哈夫曼树:
将已在内存中的哈夫曼树以直观的方式(树或凹入表形式)显示在终端上,同时将此字符形式的哈夫曼树写入文件treeprint中。
7)设字符集及频度如下表:
字符
空格
A
B
C
D
E
F
G
H
I
J
K
L
-
M
频度
186
64
23
22
32
103
^
21
15
47
57
1
5
20
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
{
56
19
2
50
51
55
30
$
10
11
3系统设计
—
(1)设计思路及方案
本课题是用最优二叉树即哈夫曼树来实现哈夫曼编码译码器的功能。
假设每种字符在电文中出现的次数为Wi,编码长度为Li,电文中有n种字符,则电文编码总长度为(W1*L1)+(W2*L2)+…+(Wi*Li)。
若将此对应到二叉树上,Wi为叶结点,Li为根结点到叶结点的路径长度。
那么,(W1*L1)+(W2*L2)+…+(Wi*Li)恰好为二叉树上带权路径长度。
因此,设计电文总长最短的二进制前缀编码,就是以n种字符出现的频率作权,构造一棵哈夫曼树,此构造过程称为哈夫曼编码。
该系统将实现以下几大功能:
从硬盘读取字符串,建立哈夫曼树,输出哈夫曼树的存储结构的初态和终态,输出各种字符出现的次数以及哈夫曼编码的译码等。
(2)模块的设计及介绍
①从硬盘读取字符串
fileopen(参数)
*
实现命令;
打印输出;
}
②建立HuffmanTree
通过三个函数来实现:
voidselect(参数)
。
初始化;
for
{
接受命令;
处理命令;
说明:
在ht[1....k]中选择parent为0且权值最小的两个根结点的算法
intjsq(参数)
}
;
统计字符串中各种字母的个数以及字符的种类
voidChuffmanTree()
输出字符统计情况;
构造哈夫曼树
③输出哈夫曼树的存储结构的初态和终态
分别调用print1()和print2()来实现
voidprint1(参数)
输出初态;
输出哈夫曼树的初态
voidprint2(参数)
输出终态;
输出哈夫曼树的终态
④哈夫曼编码和译码
voidHuffmanEncoding(参数)
.
定义变量;
{
哈夫曼编码
char*decode(参数)
·
while
接受命令;
处理命令;
哈夫曼译码
\
(3)主要模块程序流程图
下面介绍三个主要的程序模块流程图:
①主函数流程图:
图
/
流程图注释:
该图比较简单,主要是调用各个函数模块,首先代开已经存在的文件,然后统计总的字符数以及出现的各个字符和频率。
然后才开始建立哈夫曼树,接着在哈夫曼树的基础上对其进行编码,编码之后才是译码。
最后输出结束。
②构造哈夫曼树:
】
该图是表示构造哈夫曼树的过程。
首先输入num个叶结点的权值,当i=num是循环结束。
然后进行哈夫曼树的构建,当i=2*num-1是循环结束。
最后输出所得到的字符统计情况。
③哈夫曼编码:
图
流程图解释:
该流程图表四哈夫曼编码情况。
首先初始化,Cd[--start]=0,start=num。
然后进行
编码,使用了一个三目运算符。
cd[--start]=(T[p].lchild==c)'
0'
:
'
1'
,即当cd[--start]=T[p].lchild==c时,cd[--start]=0;
当cd[--start]=T[p].lchild!
==c时,cd[--start]=1。
这个编码循环一直到i=num时结束。
|
4系统实现
各模块关键代码及算法的解释:
(1)主调函数
代码解释:
这是main函数里的各个函数调用情况。
fileopen(string);
..k]中选择parent为0且权值最小的两个根结点的算法,其序号为s1和s2。
voidselect(HuffmanTreeT,intk,int&
s1,int&
s2)
inti,j;
intmin1=101;
for(i=1;
i<
=k;
i++)
if(T[i].weight<
min1&
T[i].parent==0)
{
:
j=i;
min1=T[i].weight;
}
s1=j;
min1=32767;
for(i=1;
if(T[i].weight<
T[i].parent==0&
i!
=s1)
{
j=i;
}
s2=j;
下面函数用来统计字符串中各种字母的个数以及字符的种类。
当字符在A和Z之间时即被计数,并用str[j]保存字母到数组中,用cnt[j]统计每种字符个数。
j返回总共读取的字符数目。
intjsq(char*s,intcnt[],charstr[])
inti,j,k;
char*p;
inttemp[27];
=26;
temp[i]=0;
for(p=s;
*p!
='
\0'
p++)
{
if(*p>
A'
*p<
Z'
)
k=*p-64;
temp[k]++;
《
}child=0;
HT[i].rchild=0;
HT[i].parent=0;
HT[i].weight=0;
}
=num;
i++)eight=cnt[i];
for(i=num+1;
=2*num-1;
select(HT,i-1,s1,s2);
:
HT[s1].parent=i;
HT[s2].parent=i;
HT[i].lchild=s1;
HT[i].rchild=s2;
HT[i].weight=HT[s1].weight+HT[s2].weight;
..k]中选择parent为0且权值最小
h=str[i];
h,cnt[i++]);
}arent)>
0)child==c)'
c=p;
}its,&
cd[start]);
H[i].len=num-start;
对str所代表的字符串进行编码并写入文件。
将翻译的二进制码写入文本文件。
voidcoding(HuffmanCodeHC,char*str)
inti,j;
FILE*fp;
fp=fopen("
"
"
w"
);
while(*str)
for(i=1;
if(HC[i].ch==*str){
for(j=0;
j<
=HC[i].len;
j++)
fputc(HC[i].bits[j],fp);
break;
str++;
}fclose(fp);
(4)电文译码
代码文件的译码,将翻译的二进制码译成原来的字符。
char*decode(HuffmanCodeHC)
{FILE*fp;
charstr[254];
its,cd)==0)
{
str[k]=HC[j].ch;
k++;
cjs=1;
break;
据结构(C语言版).清华大学出版社,2007
[2]苏仕华.数据结构课程设计.机械工业出版社,2007
[
[3]谭浩强.C语言程序设计教程.高等教育出版社,2006
附录源程序
#include<
#include<
..k]中选择parent为0且权值最小的两个根结点的算法
eight<
{child=0;
{..k]中选择parent为0且权值最小的两个根结点
arent=i;
for(i=0;
i++)h=str[i];
arent)>
strcpy(H[i].bits,&
#
{ch==*str){
str++;
its,cd)==0)h;
}
}
`
str[k]='
p=str;
returnp;
arent=0;
HT[x].lchild=0;
HT[x].rchild=0;
printf("
%11d%d\t%d\t%d\n"
HT[x].weight,HT[x].parent,HT[x].lchild,HT[x].rchild);
printf("
--------------------------------------\n"
voidprint2(HuffmanTreeHT)
intk;
for(k=1;
k<
k++)
%d\t%d\t%d\t%d\n"
HT[k].weight,HT[k].parent,HT[k].lchild,HT[k].rchild);
voidDhuffmanTree(HuffmanTreeHT,intcnt[],charstr[])
{eight=cnt[i];
if(i>
=str[i])
HT[i].weight=(char)'
*'
;
//*************************打开文本****************************************
intfileopen(charstring[])
if((fp=fopen("
E:
\\数据结构课程设计\\"
r"
))==NULL)
不能打开文件!
\n"
exit
(1);
while(fgets(string,100,fp)!
=NULL)
%s\n"
string);
fclose(fp);
return0;
//*************************主调函数****************************************
voidmain()
charstring[100];
char*s,str[27];
intcnt[27];
HuffmanTreeHT;
HuffmanCodeHC;
读出文本为:
fileopen(string);
num=jsq(string,cnt,str);
//统计字符的种类及各类字符出现的频率
DhuffmanTree(HT,cnt,str);
HuffmanTree的初态:
print1(HT);
ChuffmanTree(HT,HC,cnt,str);
//建立哈夫曼树
HuffmanEncoding(HT,HC);
//生成哈夫曼编码
coding(HC,string);
//建立电文哈夫曼编码文件
HuffmanTree的终态:
print2(HT);
s=decode(HC);
//读编码文件译码
译码后的字符串:
s);
//输出译码后的字符串
**********************************************************\n"