哈夫曼编码译码器系统.docx

资源描述

哈夫曼编码译码器系统.docx

《哈夫曼编码译码器系统.docx》由会员分享，可在线阅读，更多相关《哈夫曼编码译码器系统.docx（24页珍藏版）》请在冰豆网上搜索。

哈夫曼编码译码器系统.docx

哈夫曼编码译码器系统

具体介绍：

在本课题中，我们在硬盘E盘中预先建立一个file1.txt文档，在里面编辑一篇文章（大写）。

然后运行程序，调用fileopen（）函数读出该文章，显示在界面；再调用jsq（）函数对该文章的字符种类进行统计，并对每个字符的出现次数进行统计，并且在界面上显示；然后以每个字符出现次数作为权值，调用ChuffmanTree（）函数构建哈夫曼树；并调用print1（）和print2（）函数将哈夫曼的存储结构的初态和终态进行输出。

然后调用HuffmanEncoding（）函数对哈夫曼树进行编码，调用coding（）函数将编码写入文件；再调用decode（）对编码进行译码，再输出至界面。

至此，整个工作就完成了。

测试数据：

例如从文本中读到文章为：

IAMASTUDENT。

则效果如下：

IAMASTUDENT

--------------------------------------

HuffmanTree的初态:

2000

1000

2000

1000

-000

--------------------------------------

字符A次数:

字符D次数:

字符E次数:

字符I次数:

字符M次数:

字符N次数:

字符S次数:

字符T次数:

字符U次数:

--------------------------------------

HuffmanTree的终态:

21300

11000

11100

11200

21400

11300

21423

21545

21567

31691

416810

4171112

7171314

1101516

--------------------------------------

译码后的字符串:

IAMASTUDENT

**********************************************************

Pressanykeytocontinue

三维谷屋

3系统（项目）设计

（1）设计思路及方案

本课题是用最优二叉树即哈夫曼树来实现哈夫曼编码译码器的功能。

假设每种字符在电文中出现的次数为Wi，编码长度为Li，电文中有n种字符，则电文编码总长度为（W1*L1）+（W2*L2）+…+（Wi*Li）。

若将此对应到二叉树上，Wi为叶结点，Li为根结点到叶结点的路径长度。

那么，（W1*L1）+（W2*L2）+…+（Wi*Li）恰好为二叉树上带权路径长度。

三维谷屋

因此，设计电文总长最短的二进制前缀编码，就是以n种字符出现的频率作权，构造一棵哈夫曼树，此构造过程称为哈夫曼编码。

该系统将实现以下几大功能：

从硬盘读取字符串，建立哈夫曼树，输出哈夫曼树的存储结构的初态和终态，输出各种字符出现的次数以及哈夫曼编码的译码等。

（2）模块的设计及介绍

①从硬盘读取字符串

fileopen（参数）

{

实现命令；

打印输出；

}

②建立HuffmanTree

通过三个函数来实现：

voidselect（参数）

{

初始化；

for

{

接受命令；

处理命令；

}

说明：

在ht[1....k]中选择parent为0且权值最小的两个根结点的算法

intjsq（参数）

{

初始化；

for

{

接受命令；

处理命令；

}

说明：

统计字符串中各种字母的个数以及字符的种类

voidChuffmanTree（）

{

初始化；

for

{

接受命令；

处理命令；

}

输出字符统计情况；

}

说明：

构造哈夫曼树

③输出哈夫曼树的存储结构的初态和终态

分别调用print1（）和print2（）来实现

voidprint1（参数）

{

初始化；

输出初态；

}

说明：

输出哈夫曼树的初态

voidprint2（参数）

{

for

{

输出终态；

}

说明：

输出哈夫曼树的终态

④哈夫曼编码和译码

voidHuffmanEncoding（参数）

{

定义变量；

{

处理命令；

}

说明：

哈夫曼编码

char*decode（参数）

{

定义变量；

while

{

接受命令；

处理命令；

}

说明：

哈夫曼译码

（3）主要模块程序流程图

下面介绍三个主要的程序模块流程图：

①主函数流程图：

图3.1

流程图注释：

该图比较简单，主要是调用各个函数模块，首先代开已经存在的文件，然后统计总的字符数以及出现的各个字符和频率。

然后才开始建立哈夫曼树，接着在哈夫曼树的基础上对其进行编码，编码之后才是译码。

最后输出结束。

②构造哈夫曼树：

图3.2

流程图注释：

该图是表示构造哈夫曼树的过程。

首先输入num个叶结点的权值，当i=num是循环结束。

然后进行哈夫曼树的构建，当i=2*num-1是循环结束。

最后输出所得到的字符统计情况。

三维谷屋返利

③哈夫曼编码：

图3.3

流程图解释：

该流程图表四哈夫曼编码情况。

首先初始化，Cd[--start]=0,start=num。

然后进行

编码，使用了一个三目运算符。

cd[--start]=（T[p].lchild==c）?

'0':

'1'，即当cd[--start]=T[p].lchild==c时，cd[--start]=0；当cd[--start]=T[p].lchild！

==c时，cd[--start]=1。

这个编码循环一直到i=num时结束。

4系统实现

各模块关键代码及算法的解释：

1主调函数

代码解释：

这是main函数里的各个函数调用情况。

fileopen（string）;//从硬盘中读取文件

num=jsq（string,cnt,str）;//统计字符种类及各类字符出现的频率

DhuffmanTree（HT,cnt,str）;

printf（"HuffmanTree的初态:

\n"）;

print1（HT）;//输出哈夫曼树的初态

ChuffmanTree（HT,HC,cnt,str）;//建立哈夫曼树

HuffmanEncoding（HT,HC）;//生成哈夫曼编码

printf（"HuffmanTree的终态:

\n"）;

print2（HT）;//输出哈夫曼树的终态

s=decode（HC）;//读编码文件译码　

printf（"译码后的字符串:

\n"）;

printf（"%s\n",s）;//输出译码后的字符串

2建立HuffmanTree

代码解释：

该函数为在ht[1....k]中选择parent为0且权值最小的两个根结点的算法，其序号为s1和s2。

voidselect（HuffmanTreeT,intk,int&s1,int&s2）

{

inti,j;

intmin1=101;

for（i=1;i<=k;i++）

if（T[i].weight

{

j=i;min1=T[i].weight;

}

s1=j;min1=32767;

for（i=1;i<=k;i++）

if（T[i].weight

=s1）

{

j=i;min1=T[i].weight;

}

s2=j;

}

代码解释：

下面函数用来统计字符串中各种字母的个数以及字符的种类。

当字符在A和Z之间时即被计数，并用str[j]保存字母到数组中，用cnt[j]统计每种字符个数。

j返回总共读取的字符数目。

intjsq（char*s,intcnt[],charstr[]）

{

inti,j,k;

char*p;

inttemp[27];

for（i=1;i<=26;i++）

temp[i]=0;

for（p=s;*p!

='\0';p++）

{

if（*p>='A'&&*p<='Z'）

k=*p-64;

temp[k]++;

}

}//统计各种字符的个数

for（i=1,j=0;i<=26;++i）

if（temp[i]!

=0）

{

j++;

str[j]=i+64;//送对应的字母到数组中

cnt[j]=temp[i];//存入对应字母的权值

}

returnj;//j是输入字母总数

}

代码解释：

下面函数用来构造哈夫曼树HT。

首先初始化哈夫曼树，然后输入前面统计的各结点的权值，用for循环来构造哈夫曼树。

voidChuffmanTree（HuffmanTreeHT,HuffmanCodeHC,intcnt[],charstr[]）

{

inti,s1,s2;

for（i=1;i<=2*num-1;i++）//初始化HT，2*num-1是指哈夫曼

//所有的结点数目

{

HT[i].lchild=0;HT[i].rchild=0;

HT[i].parent=0;HT[i].weight=0;

}

for（i=1;i<=num;i++）//输入num个叶结点的权值

HT[i].weight=cnt[i];

for（i=num+1;i<=2*num-1;i++）

{

select（HT,i-1,s1,s2）;

HT[s1].parent=i;HT[s2].parent=i;

HT[i].lchild=s1;HT[i].rchild=s2;

HT[i].weight=HT[s1].weight+HT[s2].weight;

}

//在ht[1....k]中选择parent为0且权值最小

//的两个根结点,其序号为s1和s2,i为双亲

for（i=0;i<=num;i++）//输入字符集的中字符

HC[i].ch=str[i];//字符的种类

i=1;while（i<=num）

printf（"字符%c次数:

%d\n",HC[i].ch,cnt[i++]）;

}//输出统计的情况

3生成Huffman编码并写入文件

代码解释：

根据哈夫曼树T求哈夫曼编码H。

voidHuffmanEncoding（HuffmanTreeT,HuffmanCodeH）

{

intc,p,i;//c和p分别指示t中孩子和双亲

charcd[n];//临时存放编码串

intstart;//指示码在cd中的起始位置

cd[num]='\0';//最后一位（第num个）放上串结束符

for（i=1;i<=num;++i）

{

start=num;//初始位置

展开阅读全文