第八讲 文件.docx
《第八讲 文件.docx》由会员分享,可在线阅读,更多相关《第八讲 文件.docx(19页珍藏版)》请在冰豆网上搜索。
第八讲文件
第8讲文件
8.1 文件的基本概念
1.文件的概念
文件——是指一组相关数据的有序集合。
这个数据集有一个名称,叫做文件名。
◇文件通常是驻留在外部介质(如磁盘等)上的,在使用时才调入内存中来。
2.文件系统
⑴缓冲文件系统
标准C/C++采用缓冲文件系统——操作系统在内存中为每个正在操作的文件开辟一个读写缓冲区:
⑵非缓冲文件系统
操作系统不为操作的文件开辟缓冲区,而是由程序中为文件设定缓冲区。
3.文件的分类
从不同的角度可对文件作不同的分类。
⑴从用户角度分类
从用户的角度看,文件可分为普通文件和设备文件两种。
普通文件——是指驻留在磁盘或其它外部介质上的一个有序数据集,可以是源文件、目标文件、可执行程序;也可以是一组待输入处理的原始数据,或者是一组输出的结果。
设备文件——是指与主机相联的各种外部设备,如显示器、打印机、键盘等。
在操作系统中,把外部设备也看作是一个文件来进行管理,把它们的输入、输出等同于对磁盘文件的读和写。
例如,DOS下显示屏幕的设备名为CON,如要把文件jj.txt在屏幕上输出,可能用命令:
c:
\>copyjj.txtcon
显示器常被定义为标准输出文件(CON),一般情况下在屏幕上显示有关信息就是向标准输出文件输出。
如前面经常使用的printf,putchar函数就是这类输出。
键盘通常被指定标准的输入文件,从键盘上输入就意味着从标准输入文件上输入数据。
scanf,getchar函数就属于这类输入。
⑵按文件编码方式分类
从文件编码的方式来看,文件可分为ASCII码文件和二进制码文件两种。
ASCII文件——也称为文本文件,这种文件在磁盘中存放时每个字符对应一个字节,用于存放对应的ASCII码。
例如,数串“5678”的存储形式为:
ASCII码:
00110101001101100011011100111000
↓↓↓↓
十进制码:
5678
共占用4个字节。
ASCII码文件可在屏幕上按字符显示,例如源程序文件就是ASCII文件,用DOS命令TYPE可显示文件的内容。
由于是按字符显示,因此能读懂文件内容。
二进制文件——是按二进制的编码方式来存放文件的。
例如,数5678的存储形式为:
0001011000101110
只占二个字节。
二进制文件虽然也可在屏幕上显示,但其内容无法读懂。
C系统在处理这些文件时,并不区分类型,都看成是字符流,按字节进行处理。
输入输出字符流的开始和结束只由程序控制而不受物理符号(如回车符)的控制。
因此也把这种文件称作“流式文件”。
4.文件指针
在C语言中用一个指针变量指向一个文件,这个指针称为文件指针。
定义说明文件指针的一般形式为:
FILE*指针变量标识符;
DefinedInstdio.h
Syntax:
typedefstruct{
shortlevel;//缓冲区满空程度
unsignedflags;/文件状态标志
charfd;//文件描述符
unsignedcharhold;//
shortbsize;//缓冲区大小
unsignedchar*buffer,//指向缓冲区的指针
unsignedchar*curp;//指向文件的定位指针
unsignedistemp;//临时文件指示器
shorttoken;//用于有效性检验
}FILE;
Description:
Filecontrolstructureforstreams.
在编写源程序时不必关心FILE结构的细节。
例如:
FILE*fp;
习惯上也笼统地把fp称为指向一个文件的指针。
8.2文件操作的相关函数
8.2.1文件的打开与关闭
文件在进行读写操作之前要先打开,使用完毕要关闭。
打开文件——实际上是建立文件的各种有关信息,并使文件指针指向该文件,建立文件缓冲区,以便进行其它操作。
关闭文件——则断开指针与文件之间的联系,释放文件缓冲区,也就禁止再对该文件进行操作。
1.文件的打开(fopen函数)
fopen函数用来打开一个文件,其调用的一般形式为:
文件指针名=fopen(文件名,使用文件方式);
其中,
文件指针名:
必须是被说明为FILE类型的指针变量;
文件名:
是被打开文件的文件名;
使用文件方式:
是指文件的类型和操作要求。
文件名:
是字符串常量或字符串数组。
例如:
FILE*fp;
fp=fopen("filea","r");
又如:
FILE*fphzk;
使用文件的方式共有12种:
使用方式
意义
”rt”
只读打开一个文本文件,只允许读数据
”wt”
只写打开或建立一个文本文件,只允许写数据
”at”
追加打开一个文本文件,并在文件末尾写数据
“rb”
只读打开一个二进制文件,只允许读数据
“wb”
只写打开或建立一个二进制文件,只允许写数据
“ab”
追加打开一个二进制文件,并在文件末尾写数据
“rt+”
读写打开一个文本文件,允许读和写
“wt+”
读写打开或建立一个文本文件,允许读写
“at+”
读写打开一个文本文件,允许读或在文件末追加数据
“rb+”
读写打开一个二进制文件,允许读和写
“wb+”
读写打开或建立一个二进制文件,允许读和写
“ab+”
读写打开一个二进制文件,允许读,或在文件末追加数据
说明:
1)文件使用方式由r,w,a,t,b,+六个字符拼成,各字符的含义是:
r(read):
读
w(write):
写
a(append):
追加
t(text):
文本文件,可省略不写
b(banary):
二进制文件
+:
读和写
2)凡用“r”打开一个文件时,该文件必须已经存在,且只能从该文件读出数据。
3)用“w”打开的文件只能向该文件写入。
若打开的文件不存在,则以指定的文件名建立该文件,若打开的文件已经存在,则将该文件删去,重建一个新文件。
4)若要向一个已存在的文件追加新的信息,只能用“a”方式打开文件。
但此时该文件必须是存在的,否则将会出错。
5)在打开一个文件时,如果出错,fopen将返回一个空指针值NULL。
在程序中可以用这一信息来判别是否完成打开文件的工作,并作相应的处理。
因此常用以下程序段打开文件:
#include
#include
voidmain()
{
FILE*fp;
if((fp=fopen("c:
\\hzk16","rb"))==NULL)
{
printf("\nerroronopenc:
\\hzk16file!
");
getchar();
exit
(1);
}
}
这段程序的意义是,如果返回的指针为空,表示不能打开C盘根目录下的hzk16文件,则给出提示信息“erroronopenc:
\hzk16file!
”,下两行getchar();exit
(1);实现用户敲任意键后退出程序。
6)把一个文本文件读入内存时,要将ASCII码转换成二进制码,而把文件以文本方式写入磁盘时,也要把二进制码转换成ASCII码,因此文本文件的读写要花费较多的转换时间。
对二进制文件的读写不存在这种转换。
7)标准输入文件(键盘),标准输出文件(显示器),标准出错输出(出错信息)是由系统打开的,可直接使用。
2.文件关闭函数(fclose函数)
fclose函数调用的一般形式是:
fclose(文件指针);
例如:
fclose(fp);
正常完成关闭文件操作时,fclose函数返回值为0。
如返回非零值则表示有错误发生。
8.2.2 文件的读写
·字符读写函数:
fgetc和fputc
·字符串读写函数:
fgets和fputs
·数据块读写函数:
fread和fwrite
·格式化读写函数:
fscanf和fprinf
使用以上函数都要求包含头文件stdio.h。
1.字符读写函数fgetc和fputc
读字符函数fgetc
fgetc函数的功能是从指定的文件中读一个字符,函数调用的形式为:
字符变量=fgetc(文件指针);
例如:
charch;
ch=fgetc(fp);
其意义是从打开的文件fp中读取一个字符并送入ch中。
说明:
1)在fgetc函数调用中,读取的文件必须是以读或读写方式打开的。
2)读取字符的结果也可以不向字符变量赋值,
例如:
fgetc(fp);
但是读出的字符不能保存。
3)在文件内部有一个读写位置指针。
用来指向文件的当前读写字节。
在文件打开时,该指针总是指向文件的第一个字节。
使用fgetc函数后,该位置指针将向后移动一个字节。
因此可连续多次使用fgetc函数,读取多个字符。
文件内部的位置指针总是指示文件内部的当前读写位置,每读写一次,该指针均向后移动,它不需在程序中定义说明,而是由系统自动设置的。
【例】读入文件c1.txt,在屏幕上输出。
#include
#include
#include//引用函数getch()
voidmain()
{
FILE*fp;
charch;
if((fp=fopen("c:
\\temp\\c1.txt","rt"))==NULL)
{
printf("\nCannotopenfilestrikeanykeyexit!
");
getch();
exit
(1);
}
ch=fgetc(fp);
while(ch!
=EOF)
{
putchar(ch);
ch=fgetc(fp);
}
fclose(fp);//关闭文件
}
执行该程序前,先用记事本建立一个文本文件c1.txt。
写字符函数fputc
fputc函数的功能是把一个字符写入指定的文件中,函数调用的形式为:
fputc(字符量,文件指针);
其中,待写入的字符量可以是字符常量或变量,例如:
fputc('a',fp);
其意义是把字符a写入fp所指向的文件中。
说明:
1)被写入的文件可以用写、读写、追加方式打开。
2)每写入一个字符,文件内部位置指针向后移动一个字节。
3)fputc函数有一个返回值,如写入成功则返回写入的字符,否则返回一个EOF。
可用此来判断写入是否成功。
【例】从键盘输入一行字符,写入一个文件,再把该文件内容读出显示在屏幕上。
#include
#include
#include//引用函数getch()
main()
{
FILE*fp;
charch;
if((fp=fopen("c:
\\temp\\c2.txt","wt+"))==NULL)
{
printf("Cannotopenfilestrikeanykeyexit!
");
getch();
exit
(1);
}
printf("inputastring:
\n");
ch=getchar();
while(ch!
='\n')//读到加回车符退出循环
{
fputc(ch,fp);//字符写入文件
ch=getchar();//从键盘缓冲区读取字符
}
rewind(fp);//文件的读写位置指针移到文件头
ch=fgetc(fp);
while(!
feof(fp))//位置指针没移到文件尾执行循环操作
{
putchar(ch);//把ch中的字符显示在屏幕上
ch=fgetc(fp);//从文件中读取一个字符并存入ch
}
printf("\n");
fclose(fp);
}
注:
函数feof()用来判断文件读写位置指针是否移到文件结尾,使用格式为:
intfeof(文件指针)
返回非0,表示文件读写位置指针已到达文件结尾;
返回0,表示文件读写位置指针还没有达到文件结尾。
【例】把命令行参数中的前一个文件名标识的文件,复制到后一个文件名标识的文件中,如命令行中只有一个文件名则把该文件写到标准输出文件(显示器)中。
#include
#include
#include//引用函数getch()
main(intargc,char*argv[])
{
FILE*fp1,*fp2;
charch;
if(argc==1)
{
printf("havenotenterfilenamestrikeanykeyexit");
getch();
exit(0);
}
if((fp1=fopen(argv[1],"rt"))==NULL)
{
printf("Cannotopen%s\n",argv[1]);
getch();//按任意键退出
exit
(1);
}
if(argc==2)fp2=stdout;//命令行只有一个文件fp2指向标准输出
elseif((fp2=fopen(argv[2],"wt+"))==NULL)
{
printf("Cannotopen%s\n",argv[1]);
getch();
exit
(1);
}
while((ch=fgetc(fp1))!
=EOF)
fputc(ch,fp2);
fclose(fp1);
fclose(fp2);
}
说明:
stdout:
是标准输出文件指针,即显示器。
2.字符串读写函数fgets和fputs
读字符串函数fgets
函数的功能是从指定的文件中读一个字符串到字符数组中,函数调用的形式为:
fgets(字符数组名,n,文件指针);
其中的n是一个正整数。
表示从文件中读出的字符串不超过n-1个字符。
在读入的最后一个字符后加上串结束标志'\0'。
例如:
fgets(str,n,fp);
的意义是从fp所指的文件中读出n-1个字符送入字符数组str中。
【例】从文件中读入一个含10个字符的字符串。
#include
#include
#include//引用函数getch()
main()
{
FILE*fp;
charstr[11];
if((fp=fopen("c:
\\temp\\c1.txt","rt"))==NULL)
{
printf("\nCannotopenfilestrikeanykeyexit!
");
getch();
exit
(1);
}
fgets(str,11,fp);
printf("\n%s\n",str);
fclose(fp);
}
说明:
1)在读出n-1个字符之前,如遇到了换行符或EOF,则读出结束。
2)fgets函数也有返回值,其返回值是字符数组的首地址。
所以上面程序中的:
fgets(str,11,fp);
printf("\n%s\n",str);
两句可以合并为一句:
printf("\n%s\n",fgets(str,11,fp));
写字符串函数fputs
fputs函数的功能是向指定的文件写入一个字符串,其调用形式为:
fputs(字符串,文件指针);
其中字符串可以是字符串常量,也可以是字符数组名,或指针变量,例如:
fputs(“abcd“,fp);
其意义是把字符串“abcd”写入fp所指的文件之中。
【例】向文件中追加一个字符串。
#include
#include
#include//引用函数getch()
main()
{
FILE*fp;
charch,st[20];
if((fp=fopen("c:
\\temp\\c1.txt","at+"))==NULL)
{
printf("Cannotopenfilestrikeanykeyexit!
");
getch();
exit
(1);
}
printf("inputastring:
\n");
scanf("%s",st);
fputs(st,fp);
rewind(fp);
ch=fgetc(fp);
while(ch!
=EOF)
{
putchar(ch);
ch=fgetc(fp);
}
printf("\n");
fclose(fp);
}
3.数据块读写函数fread和fwtrite
读数据块函数调用的一般形式为:
fread(buffer,size,count,fp);
写数据块函数调用的一般形式为:
fwrite(buffer,size,count,fp);
其中:
buffer是一个指针,在fread函数中,它表示存放输入数据的首地址。
在fwrite函数中,它表示存放输出数据的首地址。
size表示数据块的字节数。
count表示要读写的数据块块数。
fp表示文件指针。
例如:
fread(fa,4,5,fp);
其意义是从fp所指的文件中,每次读4个字节(一个实数)送入实数组fa中,连续读5次,即读5个实数到fa中。
【例】从键盘输入两个学生数据,写入一个文件中,再读出这两个学生的数据显示在屏幕上。
#include
#include
#include//引用函数getch()
structstu
{
charname[10];//姓名
intnum;//编号
intage;//年龄
charaddr[15];//地址
}boya[2],boyb[2],*pp,*qq;
voidmain()
{
FILE*fp;
inti;
pp=boya;
qq=boyb;
if((fp=fopen("c:
\\temp\\c3.dat","wb+"))==NULL)
{
printf("Cannotopenfilestrikeanykeyexit!
");
getch();
exit
(1);
}
printf("\ninputdata\n");
for(i=0;i<2;i++,pp++)
scanf("%s%d%d%s",pp->name,&pp->num,&pp->age,pp->addr);
pp=boya;//pp指回到结构体数组的首地址
fwrite(pp,sizeof(structstu),2,fp);
rewind(fp);
fread(qq,sizeof(structstu),2,fp);
printf("\n\nname\tnumberageaddr\n");
for(i=0;i<2;i++,qq++)
printf("%s\t%5d%7d%s\n",qq->name,qq->num,qq->age,qq->addr);
fclose(fp);
}
4. 格式化读写函数fscanf和fprintf
这两个函数的调用格式为:
fscanf(文件指针,格式字符串,输入表列);
fprintf(文件指针,格式字符串,输出表列);
例如:
fscanf(fp,"%d%s",&i,s);
fprintf(fp,"%d%c",j,ch);
【例】用fscanf和fprintf函数完成上例的问题。
#include
#include
#include//引用函数getch()
structstu
{
charname[10];
intnum;
intage;
charaddr[15];
}boya[2],boyb[2],*pp,*qq;
voidmain()
{
FILE*fp;
inti;
pp=boya;
qq=boyb;
if((fp=fopen("c:
\\temp\\c3.dat","wb+"))==NULL)
{
printf("Cannotopenfilestrikeanykeyexit!
");
getch();
exit
(1);
}
printf("\ninputdata\n");
for(i=0;i<2;i++,pp++)
scanf("%s%d%d%s",pp->name,&pp->num,&pp->age,pp->addr);
pp=boya;
for(i=0;i<2;i++,pp++)
fprintf(fp,"%s%d%d%s\n",pp->name,pp->num,pp->age,pp->addr);
rewind(fp);
for(i=0;i<2;i++,qq++)
fscanf(fp,"%s%d%d%s\n",qq->name,&qq->num,&qq->age,qq->addr);
printf("\n\nname\tnumberageaddr\n");
qq=boyb;
for(i=0;i<2;i++,qq++)
printf("%s\t%5d%7d%s\n",qq->name,qq->num,qq->age,qq->addr);
fclose(fp);
}
5.文件的随机读写
实现随机读写的关键是要按要求移动位置指针,这称为文件的定位。
8.2.3 文件定位
移动文件内部位置指针的函数主要有两个,即rewind函数和fseek函数。
⑴rewind函数前面已多次使用过,其调用形式为:
rewind(文件指针);
它的功能是把文件内部的位置指针移到文件首。
⑵fseek函数用来移动文件内部位置指针,其调用形式为:
fseek(文件指针,位移量,起始点);
其中:
文件指针:
指向被移动的文件。
位移量:
表示移动的字节数,要求位移量是long型数据,以便在文件长度大于64KB时不会出错。
当用常量表示位移量时,要求加后缀“L”。
起始点:
表示从何处开始计算位移量,规定的起始点有三种:
文件首,当前位置和文件尾。
其表示方法如下表。
起始点
表示符号
数字表示
文件首
SEEK_SET
0
当前位置
SEEK_CUR
1
文件末尾
SEEK_END
2
例如:
fseek(fp,100L,0);
其意义是把位置指针移到离文件首100个字节处。
注意:
fseek函数一般用于二进制文件。
在文本文件中由于要进行转换,故往往计算的位置会出现错误。
文件的随机读写
常用fread和fwrite函数。
【例】在上例生成的文件中读出第二个学生的数据。
#include
#include
#in