数据结构课程设计哈夫曼编码.docx
《数据结构课程设计哈夫曼编码.docx》由会员分享,可在线阅读,更多相关《数据结构课程设计哈夫曼编码.docx(17页珍藏版)》请在冰豆网上搜索。
![数据结构课程设计哈夫曼编码.docx](https://file1.bdocx.com/fileroot1/2022-12/7/486daa16-5224-48a2-b944-89bfc1788966/486daa16-5224-48a2-b944-89bfc17889661.gif)
数据结构课程设计哈夫曼编码
数据结构与算法
学号:
2012141441210
姓名:
张敏
数据结构与算法实验报告
一、题目--赫夫曼编码/译码器
1.问题描述
利用赫夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。
这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。
对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。
试为这样的信息收发站编写一个赫夫曼码的编/译码系统。
2.基本要求
一个完整的系统应具有以下功能:
(1)I:
初始化(Initialization)。
从终端读入字符集大小n,以及n个字符和n个权值,建立赫夫曼树,并将它存于文件hfmTree中。
(2)E:
编码(Encoding)。
利用已建好的赫夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。
(3)D:
译码(Decoding)。
利用已建好的赫夫曼树将文件CodeFile中的代码进行译码,结果存入文件Textfile中。
以下为选做:
(4)P:
印代码文件(Print)。
将文件CodeFile以紧凑格式显示在终端上,每行50个代码。
同时将此字符形式的编码文件写入文件CodePrin中。
(5)T:
印赫夫曼树(Treeprinting)。
将已在内存中的赫夫曼树以直观的方式(比如树)显示在终端上,同时将此字符形式的赫夫曼树写入文件TreePrint中。
3.测试要求
(1)已知某系统在通信联络中只可能出现八种字符,其频率分别为0.05,0.29,0.07,0.08,0.14,0.23,0.03,0.11,试设计赫夫曼编码。
(2)用下表给出的字符集和频度的实际统计数据建立赫夫曼树,并实现以下报文的编码和译码:
“THISPROGRAMEISMYFAVORITE”。
字符
A
B
C
D
E
F
G
H
I
J
K
L
M
频度
186
64
13
22
32
103
21
15
47
57
1
5
32
20
字符
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
频度
57
63
15
1
48
51
80
23
8
18
1
16
1
4.实现提示
(1)编码结果以文本方式存储在文件Codefile中。
(2)用户界面可以设计为“菜单”方式:
显示上述功能符号,再加上“Q”,表示退出运行Quit。
请用户键入一个选择功能符。
此功能执行完毕后再显示此菜单,直至某次用户选择了“Q”为止。
(3)在程序的一次执行过程中,第一次执行I,D或C命令之后,赫夫曼树已经在内存了,不必再读入。
每次执行中不一定执行I命令,因为文件hfmTree可能早已建好。
二、实验目的
1、了解并掌握数据结构与算法的设计方法,具备初步的独立分析和设计能力;
2、初步掌握软件开发过程的问题分析、系统设计、程序编码、测试等基本方法和技能;
3、提高综合运用所学的理论知识和方法独立分析和解决问题的能力;
4、训练用系统的观点和软件开发一般规范进行软件开发,培养软件工作者所应具备的科学的工作方法和作风。
5、了解哈夫曼树的构造原理和编解码流程
四、具体要求:
课程设计成果的内容必须由以下四个部分组成,缺一不可。
(1)上交源程序:
学生按照实验题目的具体要求所开发的所有源程序(应该放到一个文件夹中);
(2)上交程序的说明文件:
(保存在.txt中)在说明文档中应该写明上交程序所在的目录,上交程序的主程序文件名,如果需要安装,要有程序的安装使用说明;
(3)设计报告:
(保存在word文档中,文件名要求:
按照“姓名_学号_设计题目”起名,如文件名为“张三_XXX_赫夫曼编码”.doc。
打印稿用A4纸)。
其中包括:
♦题目;
♦实验目的;
♦需求分析:
在该部分中叙述实现的功能要求;
♦概要设计:
在此说明每个部分的算法设计说明(可以是描述算法的流程图),每个程序中使用的存储结构设计说明(如果指定存储结构请写出该存储结构的定义);
♦详细设计
各个算法实现的源程序,对每个题目要有相应的源程序(可以是一组源程序,每个功能模块采用不同的函数实现)。
源程序要按照写程序的规则来编写。
要结构清晰,重点函数的重点变量、重点功能部分要加上清晰的程序注释;
♦调试分析
测试数据,测试输出的结果,时间复杂度分析,和每个模块设计和调试时存在问题的思考(问题是哪些?
问题如何解决?
),算法的改进设想;
♦总结:
总结可以包括:
设计过程的收获、遇到问题及解决问题过程的思考、程序调试能力的思考、对数据结构这门课程的思考、在设计过程中对《数据结构》课程的认识等内容。
(4)考核成绩评定标准:
本课程设计的评价由三部分组成,包括程序演示(50%),课程设计报告(30%),回答教师提问(20%)。
1.程序演示:
Ø优功能完善,全部测试正确,并且能够对局部进行完善。
Ø良功能完善,但测试欠缺。
Ø中功能基本完善,但程序尚有部分错误。
Ø及格完成内存中赫夫曼编码/译码,但不涉及文件操作。
Ø不及格功能不完善,且程序错误较多,无法运行。
2.课程设计报告:
1.优包括设计内容,设计思想,已经完成的任务及达到的目标,设计思路清晰、书写条理清楚,源程序结构合理、清晰,注释说明完整,有对本次课程设计的心得体会。
2.良包括设计内容,设计思想,已经完成的任务及达到的目标,设计思路基本清晰、书写条理基本清楚,源程序结构合理、清晰,注释说明基本完整,有对本次课程设计的心得体会。
3.中课程设计报告内容基本完整,思路较清晰,书写基本清楚,源程序结构尚可,有注释说明但不完整。
4.及格课程设计报告内容基本完整,思路较差,书写尚清楚。
5.不及格课程设计报告内容不完整,书写没有条理。
3.回答教师提问:
1.优能回答教师提出的所有问题,并完全正确,思路清晰
2.良基本能回答教师提出的所有问题,有些小错误
3.中基本能回答教师提出的问题,少数问题回答错误或不清楚
4.及格能回答教师提出的问题,但较多问题回答错误或不能回答
5.不及格基本不能回答教师提出的问题
三、概要设计
A问题分析哈夫曼树的定义
1、哈夫曼树节点的数据类型定义为:
typedefstruct{//赫夫曼树的结构体
charch;
intweight;//权值
intparent,lchild,rchild;
}htnode,*hfmtree;
2、所实现的功能函数如下
1)voidhfmcoding(hfmtree&HT,hfmcode&HC,intn)初始化哈夫曼树,处理InputHuffman(HuffmanHfm)函数得到的数据,按照哈夫曼规则建立2叉树。
此函数块调用了Select()函数。
2)voidSelect(hfmtree&HT,inta,int*p1,int*p2)//Select函数,选出HT树到a为止,权值最小且parent为0的2个节点
3、intmain()
主函数:
利用已建好的哈夫曼树(如不在内存,则从文件hfmtree.txt中读入)
对文件中的正文进行编码,然后将结果存入文件codefile.txt中。
如果正文中没有要编码的字符,则键盘读入并存储到ToBeTran文件中。
读入ToBeTran中将要编码的内容,将编码好的哈夫曼编码存储到CodeFile中。
4、Encoding
编码功能:
对输入字符进行编码
5、Decoding
译码功能:
利用已建好的哈夫曼树将文件codefile.txt中的代码进行译码,结果存入文件textfile.dat中。
6、Print()打印功能函数:
输出哈夫曼树,字符,权值,以及它对应的编码。
7、主函数的简要说明,主函数主要设计的是一个分支语句,让用户挑选所实现的功能。
使用链树存储,然后分别调用统计频数函数,排序函数,建立哈夫曼函数,编码函数,译码函数来实现功能。
B系统结构图(功能模块图)
四、程序说明
1).哈夫曼编码/译码器源代码
#include
#include
#include
#include
#include
typedefstruct{//赫夫曼树的结构体
charch;
intweight;//权值
intparent,lchild,rchild;
}htnode,*hfmtree;
typedefchar**hfmcode;
voidSelect(hfmtree&HT,inta,int*p1,int*p2)//Select函数,选出HT树到a为止,权值最小且parent为0的2个节点
{
inti,j,x,y;
for(j=1;j<=a;++j){
if(HT[j].parent==0){
x=j;
break;//选出parent为零第一个的节点。
}
}
for(i=j+1;i<=a;++i){
if(HT[i].weightx=i;//选出最小的节点x、
}
}
for(j=1;j<=a;++j){
if(HT[j].parent==0&&x!
=j)//再次找一个parent为零的节点,且非最小节点。
{
y=j;
break;
}
}
for(i=j+1;i<=a;++i)
{
if(HT[i].weight=i)
{
y=i;//选出次小的节点,即非x的最小节点y、
}
}
if(x>y){
*p1=y;
*p2=x;
}
else
{
*p1=x;
*p2=y;
}
}
voidhfmcoding(hfmtree&HT,hfmcode&HC,intn)//构建赫夫曼树HT,并求出n个字符的赫夫曼编码HC
{
inti,start,c,f,m,w;
intp1,p2;
char*cd,z;
if(n<=1){
return;
}
m=2*n-1;
HT=(hfmtree)malloc((m+1)*sizeof(htnode));
for(i=1;i<=n;++i)//初始化n个叶子结点
{
printf("请输入第%d字符信息和权值:
",i);
scanf("%c%d",&z,&w);//z和w之间不识别空格、非空格、换行键。
while(getchar()!
='\n')
{
continue;
}
HT[i].ch=z;
HT[i].weight=w;
HT[i].parent=0;
HT[i].lchild=0;
HT[i].rchild=0;
}
for(;i<=m;++i)//初始化其余的结点
{
HT[i].ch='0';
HT[i].weight=0;
HT[i].parent=0;
HT[i].lchild=0;
HT[i].rchild=0;
}
for(i=n+1;i<=m;++i)//建立赫夫曼树
{
Select(HT,i-1,&p1,&p2);
HT[p1].parent=i;HT[p2].parent=i;
HT[i].lchild=p1;HT[i].rchild=p2;
HT[i].weight=HT[p1].weight+HT[p2].weight;
}
HC=(hfmcode)malloc((n+1)*sizeof(char*));
cd=(char*)malloc(n*sizeof(char));
cd[n-1]='\0';
for(i=1;i<=n;++i)//给n个字符编码
{
start=n-1;
for(c=i,f=HT[i].parent;f!
=0;c=f,f=HT[f].parent)
{
if(HT[f].lchild==c)
{
cd[--start]='0';//左孩子赋值为零
}
else
{
cd[--start]='1';//右为1
}
}
HC[i]=(char*)malloc((n-start)*sizeof(char));
strcpy(HC[i],&cd[start]);
}
free(cd);
}
intmain(){
charcode[100],h[100],hl[100];
intn,i,j,k,l;
ifstreaminput_file;//文件输入输出流
ofstreamoutput_file;
charchoice,str[100];
hfmtreeHT;
hfmcodeHC;
cout<<"\n";
while(choice!
='Q'&&choice!
='q')//当choice的值不为q且不为Q时循环
{
cout<<""<<"*************************赫夫曼编码/译码器*************************\n";
cout<<""<<"I.Init"<<""<<"E.Encoding"<<""<<"D.Decoding"<<""<<"Q.Exit\n";
cout<<"请输入您要操作的步骤:
";
cin>>choice;
if(choice=='I'||choice=='i')//初始化赫夫曼树
{
cout<<"请输入字符个数:
";
cin>>n;
hfmcoding(HT,HC,n);
for(i=1;i<=n;++i)
{
cout<"<}
output_file.open("hfmTree.txt");
if(!
output_file){
cout<<"can'toenfile!
"<return1;
}
for(i=1;i<=n;i++)
{
output_file<<"("<}
output_file.close();
cout<<"赫夫曼树已经创建完毕,并且已经放入hfmTree.txt文件中!
"<}
elseif(choice=='E'||choice=='e')//进行编码,并将字符放入ToBeTran.txt,码值放入CodeFile.txt中
{
printf("请输入字符:
");
gets(str);
output_file.open("ToBeTran.txt");
if(!
output_file)
{
cout<<"can'toenfile!
"<return1;
}
output_file<output_file.close();
output_file.open("CodeFile.txt");
if(!
output_file){
cout<<"can'toenfile!
"<return1;
}
for(i=0;ifor(j=0;j<=n;++j)
{
if(HT[j].ch==str[i])
{
output_file<break;
}
}
}
output_file.close();
cout<<"\n";
cout<<"编码完毕,并且已经存入CodeFile.txt文件!
\n";
input_file.open("CodeFile.txt");//从CodeFile.txt中读入编码,输出在终端
if(!
input_file)
{
cout<<"can'toenfile!
"<return1;
}
input_file>>code;
cout<<"编码码值为:
"<input_file.close();
}
elseif(choice=='D'||choice=='d')//读入CodeFile.txt中的编码进行译码,将译出来的字符放入Textfile.txt中
{
input_file.open("CodeFile.txt");
if(!
input_file){
cout<<"can'toenfile!
"<return1;
}
input_file>>h;
input_file.close();
output_file.open("Textfile.txt");
if(!
output_file)
{
cout<<"can'toenfile!
"<return1;
}
k=0;
while(h[k]!
='\0')//先用编码中的前几个和字符的编码相比较,然后往后移
{
for(i=1;i<=n;i++){
l=k;
for(j=0;jhl[j]=h[l];
}
hl[j]='\0';
if(strcmp(HC[i],hl)==0)
{
output_file<k=k+strlen(HC[i]);
break;
}
}
}
output_file.close();
input_file.open("Textfile.txt");
if(!
input_file){
cout<<"can'toenfile!
"<return1;
}
input_file>>h;
cout<input_file.close();
cout<<"译码结束,字符已经存入Textfile.txt文件中!
"<}
elseif(choice=='Q'||choice=='q')//退出程序
{
exit(0);
}
else//如果选了选项之外的就让用户重新选择
{
cout<<"您没有输入正确的步骤,请重新输入!
"<}
cout<}
return0;
}
5、结果分析
1、
由上图可知:
通过四次的不同格式输入,了解到了此程序只识别数字和字符,其他空格和无空格以及换行都不能读入字符或者数字。
2、当选择编码功能E时,
由上图可知:
若输入并为建立在哈夫曼树里面的字符,则会由于逻辑错误,出现乱码字样。
紧接着,输入已定义的aego中的aeg,则能编码,并且对照之前立的哈夫曼树的结构,可知道,编码成功。
3、相应地,此时我想要选择译码功能D,通过程序结果可知道,她便能直接翻译出之前存储在codefile里面的码字。
如下图
4、下面完成实验要求的任务,对thisprogramismyfavorite进行编码。
首先对将要输入的24个字母(其实有重复的字母,也可不比输入)进行赋权值:
之后,便可以得到对24个字母进行的编码,如下图:
5、最后对thisprogramismyfavorite进行编码,再译码,如下图:
六、实验心得与体会
1、在定义头文件时可多不可少,即我们可多写些头文件,肯定不会出错,但是若没有定义所引用的相关头文件,必定调试不通过;
2、通过本次数据结构的课程设计,我学习了很多在上课没懂的知识,并对求哈夫曼树及哈夫曼编码/译码的算法有了更加深刻的了解,更巩固了课堂中学习有关于哈夫曼编码的知识,真正学会一种算法了。
3、这次课程设计,我在编辑中犯了不应有的错误,设计统计字符和合并时忘记应该怎样保存数据,对文件的操作也很生疏。
在不断分析后明确并改正了错误和疏漏,我的程序有了更高的质量。
4、通过编程,我学会了更加熟悉的使用cin和cout输入和输出函数,并发现它比C语言的printf和scanf函数的格式更为简便(但必须包含头文件):
我还熟悉了在循环语句中if与break连用的用法:
break在if后面,即当满足if的条件是,则跳出此循环语句,执行循环的后面语句。
在函数中If与return连用时表示,当满足if的条件时返回函数,即函数执行完毕。
了解了用ifstreaminput_file和ofstreamoutput_file函数构造文件输入输出流。