ImageVerifierCode 换一换
格式:DOCX , 页数:17 ,大小:62.70KB ,
资源ID:3765636      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/3765636.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(哈弗曼树的文件压缩和解压实验报告C语言.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

哈弗曼树的文件压缩和解压实验报告C语言.docx

1、哈弗曼树的文件压缩和解压实验报告C语言Lab05 树结构的应用学号: 姓名: 实验时间:2011.5.241.问题描述哈弗曼树的编码与译码 功能:实现对任何类型文件的压缩与解码 输入:源文件,压缩文件 输出:解码正确性判定,统计压缩率、编码与解码速度 要求: 使用边编码边统计符号概率的方法(自适应Huffman编码) 和事先统计概率的方法(静态Huffman编码) 。2.1程序清单程序书签:1. main函数2. 压缩函数3. select函数4. encode函数5. 解压函数#include #include #include #include #include struct node l

2、ong weight; /权值 unsigned char ch;/字符 int parent,lchild,rchild; char code256;/编码的位数最多为256位 int CodeLength;/编码长度hfmnode512;void compress();void uncompress(); /主函数void main() int choice; printf(请选择13:n); printf(1.压缩文件n); printf(2.解压文件n); printf(3.退出!n); scanf(%d,&choice); if(choice=1)compress(); else i

3、f(choice=2)uncompress(); else if(choice=3)return; else printf(输入错误!);/压缩函数 void compress() int i,j; char infile20,outfile20; FILE *ifp,*ofp; unsigned char c;/ long FileLength,filelength=0; int n,m;/叶子数和结点数 int s1,s2; /权值最小的两个结点的标号 char codes256; long sumlength=0; float rate,speed; int count=0; clock

4、_t start1, start2,finish1,finish2; double duration1,duration2; void encode(struct node *nodep,int n);/编码函数 int select(struct node *nodep,int pose);/用于建哈弗曼树中选择权值最小的结点的函数 printf(请输入要压缩的文件名:); scanf(%s,infile); ifp=fopen(infile,rb); if(ifp=NULL) printf(文件名输入错误,文件不存在!n); return; printf(请输入目标文件名:); scanf

5、(%s,outfile); ofp=fopen(outfile,wb); if(ofp=NULL) printf(文件名输入错误,文件不存在!n); return; start1=clock() ;/开始计时1 /统计文件中字符的种类以及各类字符的个数 /先用字符的ASCII码值代替结点下标 FileLength=0; while(!feof(ifp) fread(&c,1,1,ifp); hfmnodec.weight+; FileLength+; FileLength-; /文件中最后一个字符的个数会多统计一次,所以要减一 hfmnodec.weight-; /再将ASCII转换为字符存入

6、到结点的ch成员里,同时给双亲、孩子赋初值-1 n=0; for(i=0;i256;i+) if(hfmnodei.weight!=0) hfmnodei.ch=(unsigned char)i; n+;/叶子数 hfmnodei.lchild=hfmnodei.rchild=hfmnodei.parent=-1; m=2*n-1;/哈弗曼树结点总数 j=0; for(i=0;i256;i+)/去掉权值为0的结点 if(hfmnodei.weight!=0) hfmnodej=hfmnodei; j+; for(i=n;im;i+)/初始化根结点 hfmnodei.lchild=hfmnode

7、i.rchild=-1; hfmnodei.parent=-1;/建立哈弗曼树 for(i=n;im;i+) s1=select(hfmnode,i-1); hfmnodei.lchild=s1; hfmnodes1.parent=i; s2=select(hfmnode,i-1); hfmnodei.rchild=s2; hfmnodes2.parent=i; hfmnodei.weight=hfmnodes1.weight+hfmnodes2.weight; /编码encode(hfmnode,n); finish1=clock();duration1=(double)(finish1-

8、start1) / CLOCKS_PER_SEC; /*printf( 哈弗曼树编码用时为:%f secondsn, duration1 );*/ printf(编码完成,是否查看编码信息: y or n?n); c=getch(); if(c=y) printf(n); printf(叶子数为%d,结点数为%dn,n,m); for(i=0;in;i+) printf(%d号叶子结点的权值为:%ld,双亲为:%d,左右孩子:%d,编码为:%sn, i,hfmnodei.weight,hfmnodei.parent,hfmnodei.lchild,hfmnodei.code); start2=

9、clock() ;/开始计时2 fseek(ifp,0,SEEK_SET);/将ifp指针移到文件开头位置 fwrite(&FileLength,4,1,ofp);/将FileLength写入目标文件的前4个字节的位置 fseek(ofp,8,SEEK_SET);/再将目标文件指针ofp移到距文件开头8个字节位置 codes0=0; /将编码信息写入目标文件 while(!feof(ifp) fread(&c,1,1,ifp); filelength+; for(i=0;i=8) for(i=0;i8;i+)/将codes的前8位01代码表示的字符存入c if(codesi=1) c=(c1)

10、|1; else c=c0) strcat(codes,00000000); for(i=0;i8;i+) if(codesi=1) c=(c1)|1; else c=c1; fwrite(&c,1,1,ofp); sumlength+; sumlength+=8;printf(编码区总长为:%ld个字节n,sumlength-8); /将sumlength和n的值写入目标文件,为的是方便解压 fseek(ofp,4,SEEK_SET); fwrite(&sumlength,4,1,ofp);/把sumlength写进目标文件的第5-8个字节里 fseek(ofp,sumlength,SEEK

11、_SET); fwrite(&n,4,1,ofp);/把叶子数n写进编码段后面的4个字节的位置 /为方便解压,把编码信息存入n后面的位置 /存储方式为:n*(字符值(1个字节)+该字符的01编码的位数(1个字节)+编码(字节数不确定,用count来计算总值) for(i=0;in;i+) fwrite(&(hfmnodei.ch),1,1,ofp); c=hfmnodei.CodeLength;/编码最长为256位,因此只需用一个字节存储 fwrite(&c,1,1,ofp); /写入字符的编码 if(hfmnodei.CodeLength%8!=0) for(j=hfmnodei.CodeL

12、ength%8;j8;j+)/把编码不足8位的在低位补0,赋值给C,再把C写入 strcat(hfmnodei.code,0); while(hfmnodei.code0!=0)/开始存入编码,每8位二进制数存入一个字节 c=0; for(j=0;j8;j+) if(hfmnodei.codej=1) c=(c1)|1; else c=c1; strcpy(hfmnodei.code,hfmnodei.code+8);/编码前移8位,继续存入编码 count+; /编码占的字节数的总值 fwrite(&c,1,1,ofp); printf(n); finish2=clock(); durati

13、on2=(double)(finish2- start2) / CLOCKS_PER_SEC; /*printf( 写入目标文件用时为:%f secondsn, duration2);*/ printf( 压缩用时为:%f secondsn, duration1+duration2); speed=(float)FileLength/(duration1+duration2)/1000; printf(n压缩速率为:%5.2f KB/Sn,speed); printf(n); printf(源文件长度为:%ld个字节n,FileLength); sumlength=sumlength+4+n*

14、2+count; /计算压缩后文件的长度 printf(压缩后文件长度为:%ld个字节n,sumlength); rate=(float)sumlength/(float)FileLength; printf(压缩率(百分比)为:%4.2f%n,rate*100); fclose(ifp); fclose(ofp); return; /返回书签/建立哈弗曼树中用于选择最小权值结点的函数int select(struct node *nodep,int pose) int i; int s1; long min=2147483647;/s初值为long型的最大值 for(i=0;i=pose;i

15、+) if(nodepi.parent!=-1)continue; if(nodepi.weightmin) min=nodepi.weight; s1=i; return s1;/返回书签/哈弗曼编码函数void encode(struct node *nodep,int n) /从叶子向根求每个字符的哈弗曼编码 int start; int i,f,c; char codes256; codesn-1=0; /编码结束符 for(i=0;in;i+) /逐个字符求哈弗曼编码 start=n-1; for(c=i,f=nodepi.parent;f!=-1;c=f,f=nodepf.pare

16、nt) start-; if(nodepf.lchild=c) codesstart=0; else codesstart=1; strcpy(nodepi.code,&codesstart); nodepi.CodeLength=strlen(nodepi.code); /返回书签/解压函数void uncompress() /解压文件 clock_t start, finish; double duration; FILE *ifp,*ofp; char infile20,outfile20; long FileLength,sumlength,filelength; int n,m; i

17、nt i,j,k; char buf256,codes256; unsigned char c; int maxlength; float speed; printf(请输入要解压的文件名:); scanf(%s,infile); ifp=fopen(infile,rb); if(ifp=NULL) printf(文件名输入错误,文件不存在!n); return; printf(请输入目标文件名:); scanf(%s,outfile); ofp=fopen(outfile,wb); if(ofp=NULL) printf(文件名输入错误,文件不存在!n); return; start=clo

18、ck() ;/开始计时 fread(&FileLength,4,1,ifp);/从压缩文件读出FileLength、sumlength fread(&sumlength,4,1,ifp); fseek(ifp,sumlength,SEEK_SET); /利用sumlength读出n的值 fread(&n,4,1,ifp); printf(n解码信息:源文件长度为%d个字节,字符种类n=%dn,FileLength,n); for(i=0;i0) m=hfmnodei.CodeLength/8+1;/m为编码占的字节数 else m=hfmnodei.CodeLength/8; for(j=0;

19、jstrlen(buf);k-) strcat(hfmnodei.code,0); /再把二进制编码存进hfmnode.code中 strcat(hfmnodei.code,buf); hfmnodei.codehfmnodei.CodeLength=0;/去掉编码中多余的0 /找出编码长度的最大值 maxlength=0; for(i=0;imaxlength) maxlength=hfmnodei.CodeLength;/开始写入目标文件 fseek(ifp,8,SEEK_SET); /指针指向编码区,开始解码 filelength=0; codes0=0; buf0=0; while(1

20、) while(strlen(codes)strlen(buf);k-) strcat(codes,0);/把缺掉的0补上 strcat(codes,buf);/codes中此时存的为一串01编码 for(i=0;in;i+) /在codes中查找能使其前weight位和hfmnode.code相同的i值,weight即为codelength if(memcmp(hfmnodei.code,codes,(unsigned int)hfmnodei.CodeLength)=0) break; strcpy(codes,codes+hfmnodei.CodeLength);/更新codes的值 c

21、=hfmnodei.ch; fwrite(&c,1,1,ofp); filelength+; if(filelength=FileLength) break;/写入结束 finish = clock(); duration = (double)(finish - start) / CLOCKS_PER_SEC; printf( n解压完成,解压用时为:%f secondsn, duration ); fseek(ifp,0,SEEK_SET); FileLength=0; while(!feof(ifp) fread(&c,1,1,ifp); FileLength+; FileLength-;

22、 speed=(float)FileLength/duration/1000; /*printf(此文件长度为:%ld个字节n,FileLength);*/ printf(n解压速度为:%5.2fKB/Sn,speed); fclose(ifp); fclose(ofp); return;2.2程序运行结果:1.对文件xue.doc(45,056字节)进行压缩,压缩后存储在文件b.txt中,压缩速率为:3003.73KB/S,压缩率为75.50%。程序运行结果截图如下:2.再对b.txt文件进行解压,目标文件为pp.doc,解压后的文件PP.doc与源文件xue.doc完全相同,解压速度为18

23、0.94 KB/S。程序运行结果如下:2.3算法描述(1)压缩文件压缩文件时要先对源文件进行统计,统计字符的种类及出现的次数(即权值)。统计完成之后,建立哈弗曼树:每次选取权值最小且无parent的结点作为左右孩子,建成一棵二叉树,且设置新的二叉树的根结点的权值为其左右孩子的权值之和。直至建成含有2*n-1个结点的哈弗曼树。给每种字符进行编码。按照从叶子到根的顺序求其编码。算法和图示如下:for(i=0;in;i+) start=n-1; for(c=i,f=nodepi.parent;f!=-1;c=f,f=nodepf.parent) start-; if(nodepf.lchild=c)

24、 codesstart=0; else codesstart=1; strcpy(nodepi.code,&codesstart);编码完成之后,开始对源文件进行压缩。1.从源文件读一个字符,从叶子结点中找出和此字符相同的字符结点,将其编码写入一个临时字符组codes;2.当codes的长度大于等于8时,将其前8位转换成字符写入目标文件中;3.重复1和2此过程,直至读完源文件中的所有字符;4.若codes最后还有剩余的不足8位的01代码,则将其低位补0至8位,再写入目标文件。 同时为了便于解码,将源文件的长度FileLength、编码区的长度以及叶子结点的个数n、每个叶子结点的信息也存入目标文

25、件。存储方式如下图所示:FileLength4BSumlength4B源文件编码区叶子数n4B叶子结点信息字符值1B字符的编码位数1B字符的编码. | 1个结点的信息| sumlength(2)解压文件 从被压缩的文件中读出FileLength、n的值,以及每个叶子结点的信息:字符、字符对应的编码。 开始解码: 1.从被压缩的文件编码区读出一个字符,将其值转化成二进制形式(不足8位的高位要补0),存入codes中,直至codes的长度不小于所有叶子结点的编码的长度; 2.用for循环查找出第一个和codes的01字符串匹配的叶子结点编码,将该叶子结点的字符写入目标文件,并将codes的字符串前移,前移位数=该叶子结点编码的长度。 3.重复1和2过程,直至写入的字符数与源文件的长度FileLength相同。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1