实验四 文件系统 实验报告文档格式.docx

上传人:b****6 文档编号:21745947 上传时间:2023-02-01 格式:DOCX 页数:29 大小:27.34KB
下载 相关 举报
实验四 文件系统 实验报告文档格式.docx_第1页
第1页 / 共29页
实验四 文件系统 实验报告文档格式.docx_第2页
第2页 / 共29页
实验四 文件系统 实验报告文档格式.docx_第3页
第3页 / 共29页
实验四 文件系统 实验报告文档格式.docx_第4页
第4页 / 共29页
实验四 文件系统 实验报告文档格式.docx_第5页
第5页 / 共29页
点击查看更多>>
下载资源
资源描述

实验四 文件系统 实验报告文档格式.docx

《实验四 文件系统 实验报告文档格式.docx》由会员分享,可在线阅读,更多相关《实验四 文件系统 实验报告文档格式.docx(29页珍藏版)》请在冰豆网上搜索。

实验四 文件系统 实验报告文档格式.docx

其中,引导区中储存着一些基本的信息。

例如,0x0000000B和0x0000000C两个字节保存着每个扇区的大小,0x0000000D保存着每个簇占用多少个扇区。

FAT区中储存着簇号。

在0x00000200开始的三个字节,分别储存设备类型标记(0xF0为软盘);

第二个第三个字节均为0xFF,是FAT标识符。

在FAT12文件系统中,每个簇占用12位,即1.5个字节。

簇号与地址的对应关系如下表:

地址偏移

000

001

002

003

004

005

簇序号

一个簇号跨越两个字节,每次读取簇号时读取两个字节,然后对读出的两个字节进行位运算处理,得到下一簇的簇序号。

注意,这里同样需要对高低位进行处理,即使用位计算的方式提取相应的簇号信息。

根据上述的原理,可以得出一个函数,以一个簇号为参数,返回值为文件下一个簇号。

代码如下:

intgetNextClutserId(FILE*fp,shortclusterId)

{

unsignedshorttmp,low=0,high=0;

;

intaddress=(clusterId*3/2)+0x0000200;

fseek(fp,address,SEEK_SET);

fread((void*)(&

tmp),1,sizeof(unsignedshort),fp);

low=((tmp&

0xFFF0)>

>

4);

high=tmp&

0x0FFF;

return(clusterId%2==0?

high:

low);

}

其中,fp是用于读取文件系统的文件流,clusterID是当前簇号,返回值是下一个簇号。

函数体的第二句代码,计算出当前簇号对应的地址,用于文件指针的定位。

第三句代码是根据第二句计算得到的地址对文件指针进行定位,定位到当前簇号所对应的信息处。

第四句代码是从文件指针的位置为起始位置读入两个字节的内容(fread会自动对高低字节位进行处理)。

并把这两个字节的信息储存到tmp变量之中。

例如,读取002簇号的下一个簇号,根据公式,计算得到的address是0x00000203,读取到0x00000203和0x00000204两个字节的内容。

我们需要的是0x00000203整个字节的内容和0x00000204的高四位,所以需要跟0xFFF0进行位与运算,并向右移四位,得到下一个簇号。

同样地,读取003簇号的下一个簇号,根据公式,计算得到的address是0x00000204,读取到0x00000204和0x00000205两个字节的内容,我们需要的是0x00000205整个字节的内容和0x00000204第四位的内容,所以需要跟0x0FFF进行位与运算,得到下一个簇号。

所以代码中需要对簇号的奇偶性进行判断,跟根据奇偶性的不同返回不同的值。

在根目录中,保存着根目录下面的文件或文件夹的信息。

每个文件或者文件夹的信息使用32个字节保存。

这些内容的含义如下表:

地址

2

3

4

5

6

7

8

A

B

C

D

E

F

内容

文件名

扩展名

属性

保留位

时间

日期

首簇号

文件大小

这里可以看出点问题,FAT中采用4个字节保存文件的大小,也就是说,文件的大小不能超过232字节,也就是4G;

文件名和扩展名采用了固定长度,分别为8和3,太长的文件名在FAT中是不允许的。

其中,文件名的第一个字节还有其他的意义,例如,当文件名的第一个字节为0x00时,表示这一项没有文件;

为0xE5时,则表示这个文件已经被删除,在编码时应该忽略这个文件。

文件的属性采用一个字节,也就是8个位来表示文件的6种属性,最高两位是保留位,没有实际意义。

这个字节的定义为:

保留

归档

卷标

系统

隐藏

只读

在列出文件列表时,对各个位进行位与运算以后,对结果进行判断,从而得出相应的属性值,根据上表,可以得出一个函数,参数是表示文件属性的那个字节,返回值是一个以字符方式显示文件属性的一个字符串

char*formatAttribute(charattribute)

char*result=(char*)malloc(sizeof(char)*7);

result[0]=((attribute&

0x01)==0x01)?

'

r'

:

-'

result[1]=((attribute&

0x02)==0x02)?

h'

result[2]=((attribute&

0x04)==0x04)?

s'

result[3]=((attribute&

0x08)==0x08)?

l'

result[4]=((attribute&

0x10)==0x10)?

d'

result[5]=((attribute&

0x20)==0x20)?

f'

result[6]='

\0'

returnresult;

因为文件属性有6种,需要6个字符分别存放六种属性,第7位则用于储存字符串的结束标记’\0’,确保输出的时候不会产生乱码。

这个函数代码是通过位与运算对文件的各个属性进行判断,并在相应的字符位用字符或者’-’填充,最后把字符串返回。

时间和日期都采用的是压缩储存,储存时间两个字节的各位含义如下:

15

14

13

11

时(0-23)

分(0-59)

两秒(0-29)

储存日期两个字节的各位含义如下:

距离1980年的年数(0-119)

月(1-12)

日(1-31)

注:

日期和时间都需要对高低字节进行交换然后再读取。

实验中使用fread方法会自动进行交换。

根据上面的原理,可以得出这样的一个函数,这个函数以表示日期和时间的两个原始值作为参数输入,返回的是一个格式形如”xxxx-xx-xxxx:

xx:

xx”的字符串,这个函数的代码如下:

char*formatDatetime(shortdate,shorttime)

intyear,month,day,hour,minute,second;

char*result=(char*)malloc(sizeof(char)*20);

year=1980+((date&

0xE000)>

9);

month=((date&

0x01E0)>

5);

day=(date&

0x001F);

hour=((time&

0xF800)>

11);

minute=((time&

0x07E0)>

second=((time&

0x001F)<

<

1);

sprintf(result,"

%d-%d%d-%d%d%d%d:

%d%d:

%d%d"

year,month/10,month%10,day/10,day%10,

hour/10,hour%10,minute/10,minute%10,

second/10,second%10);

函数的第一句,第二句是为函数运行过程中需要临时储存的数据分配储存空间,随后就是根据上述的原理,进行位与运算和移位操作,得到各项的时间属性。

最后通过sprintf函数对各个属性按照固定的格式输出到字符串之中并返回。

首簇号,指的是这个文件储存在磁盘的第一个簇的簇号,也就是文件存放的具体地址。

同样地,需要对簇号的两个字节进行高低位交换。

最后一个是文件大小,需要对四个字节进行高低字节交换,得到文件大小。

在实验中,会通过read函数每次读入32个字节,即读取FAT表中的每一项,在输出文件信息时予以分析。

另外,每个目录中都包含两个虚拟目录,文件名分别为’.’和’..’,分别表示当前目录和上一级目录。

在目录的处理时需要对其进行判断,避免在进行子目录迭代显示时进入死循环。

综上所述,可以得出从文件段中读出文件信息的源码。

下面的是一些在读取过程中所使用的一些数据结构:

structfile_info{

charfilename[8];

charextname[3];

charattributes;

charreserved[10];

shorttime;

shortdate;

shortpos;

intsize;

};

上面是表示文件信息原始信息的结构体,每个成员变量对应一个属性。

structfile_info_node{

intid;

structfile_info*info;

structfile_info_node*next;

这个文件信息链表的结点,相应地,在实验中定义了file_list_new_info方法,将文件信息添加到链表之中。

同时,为了避免递归调用,在实验中,通过一个队列的方式实现列出所有子目录文件的功能。

在下面代码中,content_char是一个指向储存上述文件结构的指针,content->

size是file_content中表示文件大小的一个整型变量,用于计算文件夹中最大文件数量,newInfo是一个file_info结构体的指针,用于储存读取到的文件信息原始值。

先把一个文件信息的原始信息从文件内容中提取出来,为此,可以实现内存复制的函数,代码如下:

intcopyTo(void*desc,void*src,intsize)

intcounter=0,i;

for(i=0;

i<

size;

i++,counter++)

*(char*)(((char*)desc)+i)=*(char*)(((char*)src)+i);

returncounter;

通过这个函数把文件信息的原始信息复制到newInfo之中。

上述的文件夹结构不仅仅适用于根目录,所有的目录的遵循这种格式,所以这里可以得出一个初步的结论:

文件夹是一种特殊的文件。

if(newInfo->

filename[0]!

=(char)0xE5&

&

newInfo->

=(char)0x00){

file_list_new_info(newInfo,&

newId,&

newInfoNode);

if((newInfo->

attributes&

0x10)==0x10)

if(newInfo->

filename[0]=='

.'

)continue;

char*buffer=(char*)malloc(sizeof(char)*9);

intj;

for(j=0;

j<

8&

filename[j]!

=(char)0x20;

j++)

{

buffer[j]=newInfo->

filename[j];

}

buffer[j]='

queue_new_task(buffer,0,0,newInfo->

pos);

}

这是放在一个for循环中的代码,先通过文件名判断这个文件是否存在,如果存在,则把文件信息添加到程序的文件信息链表之中。

再则判断是否是目录,如果是目录,则把这个目录添加到队列之中。

2.文件储存方式

FAT文件系统对空间的分配和管理是以簇为基本单位的。

所以,一个逻辑上连续的文件可能会被分散地储存在磁盘的各个位置。

操作系统输出文件时,遵循下面的步骤:

1.会先通过文件夹信息找到文件首簇号。

2.根据文件的首簇号,定位到FAT区相应位置;

读出下一个簇的簇号。

3.如果下一个簇的簇号不是结束标记(0xFFF),则会根据读出的下一个簇号定位,读出簇里面的内容。

如果读出的是结束标记,则表示文件已经读取完成。

假如一个文件被分散储存在0x012,0x022,0x302三个簇里。

从目录的信息中读出首簇号0x012,读出0x012簇里的内容;

然后再通过0x012这个簇号在FAT区中找到下一个簇号0x022,读出0x022的内容;

再通过0x022这个簇号找到下一个簇号0x302,读出0x302中的内容;

再通过0x302读出下一个簇号的内容,此时,读出的簇号为0xFFF,即表示这个文件已经结束。

本实验中,读取文件的具体实现方法如下:

1.通过一个链表,将这个文件的所有簇号储存起来。

2.遍历储存簇号的链表,逐个逐个簇读取出来并储存到内存之中,返回之。

下面是读取文件的实现所需要的一些数据结构:

structint_linked_list{

intdata;

structint_linked_list*next;

structfile_content{

structint_linked_list*curList;

void*content;

intsize;

char*filename;

其中,int_linked_list是一个储存整型的链表,file_content是一个用于保存读出文件内容和文件信息的结构体。

遍历链表的过程中,通过一个while循环实现,把读取到簇号添加到链表之中。

具体实现代码如下,tail为保存簇号链表的末尾结点指针,fp是用于读取文件的文件指针,curConnt是一个用于统计文件簇数的变量,便于后续步骤分配内存空间使用,下文同:

while((clusterId=getNextClutserId(fp,clusterId))!

=0x00000FFF)

{

curCount++;

tail->

next=(structint_linked_list*)malloc(sizeof(structint_linked_list));

next->

data=clusterId;

next=NULL;

tail=tail->

next;

把簇号读取完毕以后,开始对文件内容进行读取,下面是文件内容读取的具体实现代码,下面代码中的content是一个指向用于存放文件内容的内存空间的指针变量:

content->

size=curCount*512;

content=malloc(content->

size);

structint_linked_list*ptr=head;

inti=0,address=0xFFFFFFF;

for(ptr=head;

ptr!

=NULL;

ptr=ptr->

next,i++)

address=0x00003E00+(512*ptr->

data);

fseek(fp,address,SEEK_SET);

fread((void*)(((char*)(content->

content))+(512*i)),512,1,fp);

在for循环的第一句代码之中,通过簇号对簇所在的地址进行计算,把地址值储存到address变量之中;

第二句代码则是通过上一步计算得到的address变量对文件指针进行定位,第三句是通过fread方法把文件内容读入到内存之中。

六、实验结论

1.FAT12文件系统中,把磁盘划分成引导区、FAT区、FAT备份区、根目录区和文件数据区。

2.除了根目录以外,文件系统把每个文件夹都当成是一个特殊的文件进行处理。

3.FAT12文件系统通过簇进行空间的管理和分配。

七、完整实验代码

/*

*操作系统课程实验

*FAT12文件系统实验代码

*

*虽然这个程序在Windows和Linux环境下都能运行。

*不过,在Windows环境下运行的话,显示文件内容的时候,内容的末尾会有几个奇怪的字符。

*Linux环境下完全没问题

*暂时推测是Windows控制台的原因,Windows控制台会把一些非字符的ASCII显示为奇怪的字符,

*例如,0x0A会显示成一个笑脸,Linux的控制台下不会对这些非字符的ASCII进行处理

*我是今天早上才发现这个问题的阿(╯‵□′)╯︵┻━┻

*注意:

编译前,需要把IMAGE_FILE那个宏定义改成公邮上面的那个IMG文件;

*Linux下打开这个源码文件注释会变成乱码

*/

//这个定义只是为了程序能在VS2013下面正常编译而已

#ifdef_WIN32

#define_CRT_SECURE_NO_WARNINGS

#endif

#include<

stdio.h>

stdlib.h>

string.h>

windows.h>

#defineOK0x00000000

#defineMESSAGE_FILE_NOT_FOUND0xE0000404

#defineERROR_MALLOC_FAILED0xF0000001

#defineERROR_IO_ERROR0xF0000002

//↓这里改路径↓

#defineIMAGE_FILE"

/home/user/DOS622.IMG"

//↑这里改路径↑

/********************这里是结构体的定义**************************/

//这里是文件信息

//这里是储存文件夹信息

structfolder_info{

char*filename;

intfileBeginIndex,fileEndIndex;

structfile_info_node*beginFile,*endFile;

structfolder_info*next;

//这里是一个队列,用于迭代方式遍历文件系统的一个中间变量

structqueue_info{

intoffset,size,cluster;

structqueue_info*next;

//一个整数链表结构

intdata;

structint_linked_list*next;

//这里是一个文件结构,表示内容,可以读取文件的其中一段,也可以通过簇的方式完整读入整个文件

structint_linked_list*curList;

void*content;

/********************这里是全局变量的定义**************************/

structfile_info_node*file_list_head,*file_list_tail;

structfolder_info*folder_info_head,*folder_info_tail;

structqueue_info*queue_head,*queue_tail;

chardecToHex[16]={'

0'

'

1'

2'

3'

4'

5'

6'

7'

8'

9'

A'

B'

C'

D'

E'

F'

};

/********************这里是函数的定义**************************/

intfile_list_init();

intfile_list_new_info(structfile_info*info,int*id,structfile_info_node**newInfoNode);

intfolder_info_init();

intfolder_info_new_info(structfolder_info*info);

intqueue_init();

intqueue_new_task(cha

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 商业计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1