哈夫曼树与文件解压压缩C言代码.docx

资源描述

哈夫曼树与文件解压压缩C言代码.docx

《哈夫曼树与文件解压压缩C言代码.docx》由会员分享，可在线阅读，更多相关《哈夫曼树与文件解压压缩C言代码.docx（8页珍藏版）》请在冰豆网上搜索。

哈夫曼树与文件解压压缩C言代码.docx

哈夫曼树与文件解压压缩C言代码

1.问题描述

哈弗曼树的编码与译码

—功能：

实现对任何类型文件的压缩与解码

—输入：

源文件，压缩文件

—输出：

解码正确性判定，统计压缩率、编码与解码速度

—要求：

使用边编码边统计符号概率的方法（自适应Huffman编码）和事先统计概率的方法（静态Huffman编码）

2.1程序清单

程序书签：

1.main函数

2.压缩函数

3.select函数

4.encode函数

5.解压函数

#include

structnode{

longweight; //权值

unsignedcharch;//字符

intparent,lchild,rchild;

charcode[256];//编码的位数最多为256位

intCodeLength;//编码长度

}hfmnode[512];

voidcompress（）;

voiduncompress（）;

//主函数

voidmain（）

{

intchoice;

printf（"请选择1~3：

\n"）;

printf（"1.压缩文件\n"）;

printf（"2.解压文件\n"）;

printf（"3.退出！

\n"）;

scanf（"%d",&choice）;

if（choice==1）compress（）;

elseif（choice==2）uncompress（）;

elseif（choice==3）return;

elseprintf（"输入错误！

"）;

}

//压缩函数

voidcompress（）

{

inti,j;

charinfile[20],outfile[20];

FILE *ifp,*ofp;

unsignedcharc;//

longFileLength,filelength=0;

intn,m;//叶子数和结点数

ints1,s2;//权值最小的两个结点的标号

charcodes[256];

longsumlength=0;

floatrate,speed;

intcount=0;

clock_tstart1,start2,finish1,finish2;

double duration1,duration2;

voidencode（structnode*nodep,intn）;//编码函数

intselect（structnode*nodep,intpose）;//用于建哈弗曼树中选择权值最小的结点的函数

printf（"请输入要压缩的文件名:

"）;

scanf（"%s",infile）;

ifp=fopen（infile,"rb"）;

if（ifp==NULL）

{

printf（"文件名输入错误，文件不存在!

\n"）;

return;

}

printf（"请输入目标文件名:

"）;

scanf（"%s",outfile）;

ofp=fopen（outfile,"wb"）;

if（ofp==NULL）

{

printf（"文件名输入错误，文件不存在!

\n"）;

return;

}

start1=clock（）;//开始计时1

//统计文件中字符的种类以及各类字符的个数

//先用字符的ASCII码值代替结点下标

FileLength=0;

while（!

feof（ifp））

{

fread（&c,1,1,ifp）;

hfmnode[c].weight++;

FileLength++;

}

FileLength--;//文件中最后一个字符的个数会多统计一次，所以要减一

hfmnode[c].weight--;

//再将ASCII转换为字符存入到结点的ch成员里，同时给双亲、孩子赋初值-1

n=0;

for（i=0;i<256;i++）

if（hfmnode[i].weight!

=0）

{

hfmnode[i].ch=（unsignedchar）i;

n++;//叶子数

hfmnode[i].lchild=hfmnode[i].rchild=hfmnode[i].parent=-1;

}

m=2*n-1;//哈弗曼树结点总数

j=0;

for（i=0;i<256;i++）//去掉权值为0的结点

if（hfmnode[i].weight!

=0）

{

hfmnode[j]=hfmnode[i];

j++;

}

for（i=n;i

{

hfmnode[i].lchild=hfmnode[i].rchild=-1;

hfmnode[i].parent=-1;

}

//建立哈弗曼树

for（i=n;i

{

s1=select（hfmnode,i-1）;

hfmnode[i].lchild=s1;

hfmnode[s1].parent=i;

s2=select（hfmnode,i-1）;

hfmnode[i].rchild=s2;

hfmnode[s2].parent=i;

hfmnode[i].weight=hfmnode[s1].weight+hfmnode[s2].weight;

}

//编码

encode（hfmnode,n）;

finish1=clock（）;

duration1=（double）（finish1-start1）/CLOCKS_PER_SEC;

/*printf（"哈弗曼树编码用时为：

%fseconds\n",duration1）;*/

printf（"编码完成，是否查看编码信息:

yorn?

\n"）;

c=getch（）;

if（c=='y'）

{ printf（"\n"）;

printf（"叶子数为%d,结点数为%d\n",n,m）;

for（i=0;i

printf（"%d号叶子结点的权值为：

%ld,双亲为：

%d,左右孩子：

%d,编码为：

%s\n",

i,hfmnode[i].weight,hfmnode[i].parent,hfmnode[i].lchild,hfmnode[i].code）;

}

start2=clock（）;//开始计时2

fseek（ifp,0,SEEK_SET）;//将ifp指针移到文件开头位置

fwrite（&FileLength,4,1,ofp）;//将FileLength写入目标文件的前4个字节的位置

fseek（ofp,8,SEEK_SET）;//再将目标文件指针ofp移到距文件开头8个字节位置

codes[0]=0;

//将编码信息写入目标文件

while（!

feof（ifp））

{

fread（&c,1,1,ifp）;

filelength++;

for（i=0;i

if（c==hfmnode[i].ch）break; //ch必须也为unsigned型

strcat（codes,hfmnode[i].code）;

while（strlen（codes）>=8）

{

for（i=0;i<8;i++）//将codes的前8位01代码表示的字符存入c

{

if（codes[i]=='1'）

c=（c<<1）|1;

elsec=c<<1;

}

fwrite（&c,1,1,ofp）;//将新的字符写入目标文件

sumlength++;

strcpy（codes,codes+8）;//更新codes的值

}

if（filelength==FileLength）break;

}

//再将剩余的不足8位的01代码补全8位，继续写入

if（strlen（codes）>0）

{

strcat（codes,"00000000"）;

for（i=0;i<8;i++）

{

if（codes[i]=='1'）

c=（c<<1）|1;

elsec=c<<1;

}

fwrite（&c,1,1,ofp）;

sumlength++;

}

sumlength+=8;

printf（"编码区总长为：

%ld个字节\n",sumlength-8）;

//将sumlength和n的值写入目标文件，为的是方便解压

fseek（ofp,4,SEEK_SET）;

fwrite（&sumlength,4,1,ofp）;//把sumlength写进目标文件的第5-8个字节里

fseek（ofp,sumlength,SEEK_SET）;

fwrite（&n,4,1,ofp）;//把叶子数n写进编码段后面的4个字节的位置

//为方便解压，把编码信息存入n后面的位置

//存储方式为：

n*（字符值（1个字节）+该字符的01编码的位数（1个字节）+编码（字节数不确定，用count来计算总值））

for（i=0;i

{

fwrite（&（hfmnode[i].ch）,1,1,ofp）;

c=hfmnode[i].CodeLength;//编码最长为256位，因此只需用一个字节存储

fwrite（&c,1,1,ofp）;

//写入字符的编码

if（hfmnode[i].CodeLength%8!

=0）

展开阅读全文