实验四文件系统实验报告文档格式.docx

资源描述

实验四文件系统实验报告文档格式.docx

《实验四文件系统实验报告文档格式.docx》由会员分享，可在线阅读，更多相关《实验四文件系统实验报告文档格式.docx（29页珍藏版）》请在冰豆网上搜索。

实验四文件系统实验报告文档格式.docx

其中，引导区中储存着一些基本的信息。

例如，0x0000000B和0x0000000C两个字节保存着每个扇区的大小，0x0000000D保存着每个簇占用多少个扇区。

FAT区中储存着簇号。

在0x00000200开始的三个字节，分别储存设备类型标记（0xF0为软盘）；

第二个第三个字节均为0xFF，是FAT标识符。

在FAT12文件系统中，每个簇占用12位，即1.5个字节。

簇号与地址的对应关系如下表：

地址偏移

000

001

002

003

004

005

簇序号

一个簇号跨越两个字节，每次读取簇号时读取两个字节，然后对读出的两个字节进行位运算处理，得到下一簇的簇序号。

注意，这里同样需要对高低位进行处理，即使用位计算的方式提取相应的簇号信息。

根据上述的原理，可以得出一个函数，以一个簇号为参数，返回值为文件下一个簇号。

代码如下：

intgetNextClutserId（FILE*fp,shortclusterId）

{

unsignedshorttmp,low=0,high=0;

;

intaddress=（clusterId*3/2）+0x0000200;

fseek（fp,address,SEEK_SET）;

fread（（void*）（&

tmp）,1,sizeof（unsignedshort）,fp）;

low=（（tmp&

0xFFF0）>

4）;

high=tmp&

0x0FFF;

return（clusterId%2==0?

high:

low）;

}

其中，fp是用于读取文件系统的文件流，clusterID是当前簇号，返回值是下一个簇号。

函数体的第二句代码，计算出当前簇号对应的地址，用于文件指针的定位。

第三句代码是根据第二句计算得到的地址对文件指针进行定位，定位到当前簇号所对应的信息处。

第四句代码是从文件指针的位置为起始位置读入两个字节的内容（fread会自动对高低字节位进行处理）。

并把这两个字节的信息储存到tmp变量之中。

例如，读取002簇号的下一个簇号，根据公式，计算得到的address是0x00000203，读取到0x00000203和0x00000204两个字节的内容。

我们需要的是0x00000203整个字节的内容和0x00000204的高四位，所以需要跟0xFFF0进行位与运算，并向右移四位，得到下一个簇号。

同样地，读取003簇号的下一个簇号，根据公式，计算得到的address是0x00000204，读取到0x00000204和0x00000205两个字节的内容，我们需要的是0x00000205整个字节的内容和0x00000204第四位的内容，所以需要跟0x0FFF进行位与运算，得到下一个簇号。

所以代码中需要对簇号的奇偶性进行判断，跟根据奇偶性的不同返回不同的值。

在根目录中，保存着根目录下面的文件或文件夹的信息。

每个文件或者文件夹的信息使用32个字节保存。

这些内容的含义如下表：

地址

内容

文件名

扩展名

属性

保留位

时间

日期

首簇号

文件大小

这里可以看出点问题，FAT中采用4个字节保存文件的大小，也就是说，文件的大小不能超过232字节，也就是4G；

文件名和扩展名采用了固定长度，分别为8和3，太长的文件名在FAT中是不允许的。

其中，文件名的第一个字节还有其他的意义，例如，当文件名的第一个字节为0x00时，表示这一项没有文件；

为0xE5时，则表示这个文件已经被删除，在编码时应该忽略这个文件。

文件的属性采用一个字节，也就是8个位来表示文件的6种属性，最高两位是保留位，没有实际意义。

这个字节的定义为：

位

保留

归档

卷标

系统

隐藏

只读

在列出文件列表时，对各个位进行位与运算以后，对结果进行判断，从而得出相应的属性值，根据上表，可以得出一个函数，参数是表示文件属性的那个字节，返回值是一个以字符方式显示文件属性的一个字符串

char*formatAttribute（charattribute）

char*result=（char*）malloc（sizeof（char）*7）;

result[0]=（（attribute&

0x01）==0x01）?

result[1]=（（attribute&

0x02）==0x02）?

result[2]=（（attribute&

0x04）==0x04）?

result[3]=（（attribute&

0x08）==0x08）?

result[4]=（（attribute&

0x10）==0x10）?

result[5]=（（attribute&

0x20）==0x20）?

result[6]='

\0'

returnresult;

因为文件属性有6种，需要6个字符分别存放六种属性，第7位则用于储存字符串的结束标记’\0’，确保输出的时候不会产生乱码。

这个函数代码是通过位与运算对文件的各个属性进行判断，并在相应的字符位用字符或者’-’填充，最后把字符串返回。

时间和日期都采用的是压缩储存，储存时间两个字节的各位含义如下：

时（0-23）

分（0-59）

两秒（0-29）

储存日期两个字节的各位含义如下：

距离1980年的年数（0-119）

月（1-12）

日（1-31）

注：

日期和时间都需要对高低字节进行交换然后再读取。

实验中使用fread方法会自动进行交换。

根据上面的原理，可以得出这样的一个函数，这个函数以表示日期和时间的两个原始值作为参数输入，返回的是一个格式形如”xxxx-xx-xxxx:

xx:

xx”的字符串，这个函数的代码如下：

char*formatDatetime（shortdate,shorttime）

intyear,month,day,hour,minute,second;

char*result=（char*）malloc（sizeof（char）*20）;

year=1980+（（date&

0xE000）>

9）;

month=（（date&

0x01E0）>

5）;

day=（date&

0x001F）;

hour=（（time&

0xF800）>

11）;

minute=（（time&

0x07E0）>

second=（（time&

0x001F）<

1）;

sprintf（result,"

%d-%d%d-%d%d%d%d:

%d%d:

%d%d"

year,month/10,month%10,day/10,day%10,

hour/10,hour%10,minute/10,minute%10,

second/10,second%10）;

函数的第一句，第二句是为函数运行过程中需要临时储存的数据分配储存空间，随后就是根据上述的原理，进行位与运算和移位操作，得到各项的时间属性。

最后通过sprintf函数对各个属性按照固定的格式输出到字符串之中并返回。

首簇号，指的是这个文件储存在磁盘的第一个簇的簇号，也就是文件存放的具体地址。

同样地，需要对簇号的两个字节进行高低位交换。

最后一个是文件大小，需要对四个字节进行高低字节交换，得到文件大小。

在实验中，会通过read函数每次读入32个字节，即读取FAT表中的每一项，在输出文件信息时予以分析。

另外，每个目录中都包含两个虚拟目录，文件名分别为’.’和’..’，分别表示当前目录和上一级目录。

在目录的处理时需要对其进行判断，避免在进行子目录迭代显示时进入死循环。

综上所述，可以得出从文件段中读出文件信息的源码。

下面的是一些在读取过程中所使用的一些数据结构：

structfile_info{

charfilename[8];

charextname[3];

charattributes;

charreserved[10];

shorttime;

shortdate;

shortpos;

intsize;

};

上面是表示文件信息原始信息的结构体，每个成员变量对应一个属性。

structfile_info_node{

intid;

structfile_info*info;

structfile_info_node*next;

这个文件信息链表的结点，相应地，在实验中定义了file_list_new_info方法，将文件信息添加到链表之中。

同时，为了避免递归调用，在实验中，通过一个队列的方式实现列出所有子目录文件的功能。

在下面代码中，content_char是一个指向储存上述文件结构的指针，content->

size是file_content中表示文件大小的一个整型变量，用于计算文件夹中最大文件数量，newInfo是一个file_info结构体的指针，用于储存读取到的文件信息原始值。

先把一个文件信息的原始信息从文件内容中提取出来，为此，可以实现内存复制的函数，代码如下：

intcopyTo（void*desc,void*src,intsize）

intcounter=0,i;

for（i=0;

size;

i++,counter++）

*（char*）（（（char*）desc）+i）=*（char*）（（（char*）src）+i）;

returncounter;

通过这个函数把文件信息的原始信息复制到newInfo之中。

上述的文件夹结构不仅仅适用于根目录，所有的目录的遵循这种格式，所以这里可以得出一个初步的结论：

文件夹是一种特殊的文件。

if（newInfo->

filename[0]!

=（char）0xE5&

newInfo->

=（char）0x00）{

file_list_new_info（newInfo,&

newId,&

newInfoNode）;

if（（newInfo->

attributes&

0x10）==0x10）

if（newInfo->

filename[0]=='

）continue;

char*buffer=（char*）malloc（sizeof（char）*9）;

intj;

for（j=0;

filename[j]!

=（char）0x20;

j++）

{

buffer[j]=newInfo->

filename[j];

}

buffer[j]='

queue_new_task（buffer,0,0,newInfo->

pos）;

}

这是放在一个for循环中的代码，先通过文件名判断这个文件是否存在，如果存在，则把文件信息添加到程序的文件信息链表之中。

再则判断是否是目录，如果是目录，则把这个目录添加到队列之中。

2.文件储存方式

FAT文件系统对空间的分配和管理是以簇为基本单位的。

所以，一个逻辑上连续的文件可能会被分散地储存在磁盘的各个位置。

操作系统输出文件时，遵循下面的步骤：

1.会先通过文件夹信息找到文件首簇号。

2.根据文件的首簇号，定位到FAT区相应位置；

读出下一个簇的簇号。

3.如果下一个簇的簇号不是结束标记（0xFFF），则会根据读出的下一个簇号定位，读出簇里面的内容。

如果读出的是结束标记，则表示文件已经读取完成。

假如一个文件被分散储存在0x012，0x022，0x302三个簇里。

从目录的信息中读出首簇号0x012，读出0x012簇里的内容；

然后再通过0x012这个簇号在FAT区中找到下一个簇号0x022，读出0x022的内容；

再通过0x022这个簇号找到下一个簇号0x302，读出0x302中的内容；

再通过0x302读出下一个簇号的内容，此时，读出的簇号为0xFFF，即表示这个文件已经结束。

本实验中，读取文件的具体实现方法如下：

1.通过一个链表，将这个文件的所有簇号储存起来。

2.遍历储存簇号的链表，逐个逐个簇读取出来并储存到内存之中，返回之。

下面是读取文件的实现所需要的一些数据结构：

structint_linked_list{

intdata;

structint_linked_list*next;

structfile_content{

structint_linked_list*curList;

void*content;

intsize;

char*filename;

其中，int_linked_list是一个储存整型的链表，file_content是一个用于保存读出文件内容和文件信息的结构体。

遍历链表的过程中，通过一个while循环实现，把读取到簇号添加到链表之中。

具体实现代码如下，tail为保存簇号链表的末尾结点指针，fp是用于读取文件的文件指针，curConnt是一个用于统计文件簇数的变量，便于后续步骤分配内存空间使用，下文同：

while（（clusterId=getNextClutserId（fp,clusterId））!

=0x00000FFF）

{

curCount++;

tail->

next=（structint_linked_list*）malloc（sizeof（structint_linked_list））;

next->

data=clusterId;

next=NULL;

tail=tail->

next;

把簇号读取完毕以后，开始对文件内容进行读取，下面是文件内容读取的具体实现代码，下面代码中的content是一个指向用于存放文件内容的内存空间的指针变量：

content->

size=curCount*512;

content=malloc（content->

size）;

structint_linked_list*ptr=head;

inti=0,address=0xFFFFFFF;

for（ptr=head;

ptr!

=NULL;

ptr=ptr->

next,i++）

address=0x00003E00+（512*ptr->

data）;

fseek（fp,address,SEEK_SET）;

fread（（void*）（（（char*）（content->

content））+（512*i））,512,1,fp）;

在for循环的第一句代码之中，通过簇号对簇所在的地址进行计算，把地址值储存到address变量之中；

第二句代码则是通过上一步计算得到的address变量对文件指针进行定位，第三句是通过fread方法把文件内容读入到内存之中。

六、实验结论

1.FAT12文件系统中，把磁盘划分成引导区、FAT区、FAT备份区、根目录区和文件数据区。

2.除了根目录以外，文件系统把每个文件夹都当成是一个特殊的文件进行处理。

3.FAT12文件系统通过簇进行空间的管理和分配。

七、完整实验代码

*操作系统课程实验

*FAT12文件系统实验代码

*虽然这个程序在Windows和Linux环境下都能运行。

*不过，在Windows环境下运行的话，显示文件内容的时候，内容的末尾会有几个奇怪的字符。

*Linux环境下完全没问题

*暂时推测是Windows控制台的原因，Windows控制台会把一些非字符的ASCII显示为奇怪的字符，

*例如，0x0A会显示成一个笑脸，Linux的控制台下不会对这些非字符的ASCII进行处理

*我是今天早上才发现这个问题的阿（╯‵□′）╯︵┻━┻

*注意：

编译前，需要把IMAGE_FILE那个宏定义改成公邮上面的那个IMG文件；

*Linux下打开这个源码文件注释会变成乱码

//这个定义只是为了程序能在VS2013下面正常编译而已

#ifdef_WIN32

#define_CRT_SECURE_NO_WARNINGS

#endif

#include<

stdio.h>

stdlib.h>

string.h>

windows.h>

#defineOK0x00000000

#defineMESSAGE_FILE_NOT_FOUND0xE0000404

#defineERROR_MALLOC_FAILED0xF0000001

#defineERROR_IO_ERROR0xF0000002

//↓这里改路径↓

#defineIMAGE_FILE"

/home/user/DOS622.IMG"

//↑这里改路径↑

/********************这里是结构体的定义**************************/

//这里是文件信息

//这里是储存文件夹信息

structfolder_info{

char*filename;

intfileBeginIndex,fileEndIndex;

structfile_info_node*beginFile,*endFile;

structfolder_info*next;

//这里是一个队列，用于迭代方式遍历文件系统的一个中间变量

structqueue_info{

intoffset,size,cluster;

structqueue_info*next;

//一个整数链表结构

intdata;

structint_linked_list*next;

//这里是一个文件结构，表示内容，可以读取文件的其中一段，也可以通过簇的方式完整读入整个文件

structint_linked_list*curList;

void*content;

/********************这里是全局变量的定义**************************/

structfile_info_node*file_list_head,*file_list_tail;

structfolder_info*folder_info_head,*folder_info_tail;

structqueue_info*queue_head,*queue_tail;

chardecToHex[16]={'

};

/********************这里是函数的定义**************************/

intfile_list_init（）;

intfile_list_new_info（structfile_info*info,int*id,structfile_info_node**newInfoNode）;

intfolder_info_init（）;

intfolder_info_new_info（structfolder_info*info）;

intqueue_init（）;

intqueue_new_task（cha

展开阅读全文

实验四 文件系统 实验报告文档格式.docx

实验四文件系统实验报告文档格式.docx