1、pintospro4filesystemProject 4 FileSystem作者:西安电子科技大学2014.2.7 文件系统是操作系统的五大功能模块之一,主要实现操作系统对程序、数据、设备等的管理。一、当前pintos文件系统的功能当前pintos文件系统已经实现了基本的文件创建删除功能。文件是固定大小,连续存放的。(1)文件在磁盘的存储方式: 每个文件都有一个disk_inode存放在磁盘的一个扇区上,其结构如下:struct inode_disk block_sector_t start; /文件数据每一个起始块 off_t length; /文件长度。 unsigned magic;
2、 / uint32_t unused125;现在pintos文件是连续的,而且在创建时指定其大小后,再不能改变大小。由起始扇区和文件大小就能找到所有文件数据。目录也是一个文件,只是其内容中都存放如下结构:struct dir_entry Block_sector_t inode_sector; /文件inode_disk 所在扇区。Char nameNAME_MAX+1;Bool in_use;(2)磁盘空闲空间管理方式。空闲空间是用位图来表示的。其中位图也是一个文件,其disk inode存放在Sector 0.位图文件大小显然与磁盘大小有关,用一个位表示一个扇区是否被分配,一个扇区512字
3、节,一个扇区作为一个物理块,创建一个2M的磁盘,有1024*1024*2/512bit=4096bit= 4096/8=512Byte。(3)文件系统初始化过程:在init.c:main()函数中调用了filesys_init();1. 在filesys_init()中,初始化了bitmap,而且对磁盘进行了格式化。其中格式化就是创建了两个文件,一个用来管理空闲块的位置图文件,一个是根目录文件。2.Filesys_init()中调用了free_map_init(),在free_map_init()中调用bitmap_create()创建了位图,大小依据磁盘大小。而且标记了0 1两个扇区为已经分
4、配,作为free_map_file的disk_inode空间和根目录文件的disk_inode空间。此时free_map只是在内存中。3.Filesys_init()中又调用了do_format()在do_format()中:调用 了free_map_create(),创建了free_map_file,即一个文件,其disk_inode已经在上面分配了,再分配文件大小即可,这是由调用inode_create函数来实现的。创建这个文件时显然需要分配磁盘空闲块,就从在内存中的free_map位图中分配就可以。文件创建好了之后,打开文件,把内存中的位图free_map写到磁盘上,这是调用bitmap
5、_write()实现的,本质还是用file_write()实现的。File_write()是通过inode_write_at()写磁盘的。在do_format()中还创建根目录文件,ROOT_DIR_SECTOR已经标记了,分配文件所需要的空间就行了。4. Filesys_init()调用了free_map_open()把free_map读入内存。其实就是打开上面创建的free_map文件,读数据入内存。直到系统关闭时才将free_map写回到磁盘上。 首先在内存中建立了磁盘的位图,标记了根目录和free_map本身的disk_inode结构扇区。 上面的内存free_map一建立就保证创建文
6、件时可以分配磁盘空间了。而inode_create()中就需要调用free_map_allocate()来获取空闲物理块。如果不格式化,则以前必然格式化过,直接读入free_map就行。(4)目录创建过程。Pintos原来已经实现了创建目录的功能,但是只创建根目录,而且根目录只能包含16个文件,即16个dir_entry结构。目录本质也是一个文件,根目录是特殊的文件,在filesys.h中有宏定义:#define ROOT_DIR_SECTOR 1.在ROOT_DIR_SECTOR中,也就是第1个扇区中存放了根目录的disk_inode.上面已经提到了,在格式化时创建了根目录。(5)文件打开过
7、程。调用filesys_open().每个打开的文件在内在都维护了一个唯一的数据结构inode(为了与disk_inode区别,这个叫memory inode).以下是memory inode结构:Struct inode Struct list_elem elem; Block_sector_t sector;Int open_cnt;Bool removed;Int deny_write_cnt;Struct inode_disk data;打开一个文件显然就是在内存中创建一个inode结构,其中struct inode_disk data保存了该文件对应的磁盘中的inode. 如果此文件
8、已经打开了,则只需要增加open_cnt的值,不用再创建一个inode. 这些inode通过一个链表链结到一起的,在filesys_init()中初始化了这个链表。具体过程: 调用filesys_open(const char filename); 首先打开根目录,然后在根目录中依据filename查找文件。如果找到了,也就是找到了此文件对应的struct dir_entry结构,里面记录了文件disk_inode, disk_inode中记录文件数据起始位置和文件大小,这就可以读写文件了。当然,还需要建立文件对应的memory inode.其中 data就是此文件的disk_inode.通过
9、filesys_open()只能得到文件的inode. 如果此文件是普通文件,则调用fileopen(inode)把inode包装成struct file结构;如果是目录就调用dir_open把inode包装成struct dir.Struct file结构如下:Struct file Struct inode *inode; Off_t pos; Bool deny_write;(6)文件的创建过程.创建一个文件要有文件名和文件大小,每一个文件在磁盘中都有一个struct disk_inode结构,每个文件和目录都要在一个目录下,在目录文件中,struct dir_entry中记录了每个该目
10、录下的文件的文件名,以及每个文件disk_inode所在扇区号。具体是通过调用filesys_create(const char *name,off_t initial_size)实现的. 首先调用struct dir *dir =dir_open_root()打开根目录。以下struct dir结构。Struct dir Struct inode *inode; Off_t pos; 本质就是一个文件,读写目录与读写普通文件没有区别。然后调用free_map_allocate分配一个扇区sector作为新文件的disk_inode.再调用inode_create(sector,initial
11、_size)分配文件所需要磁盘空间,分配的空间是连续的扇区。最后创建一个struct dir_entry结构,把文件名和其sector填入其中,在目录中找一个位置放入就可以了。(7)文件的读写。调用filesys_open()打开文件,这就得到了struct file结构,如下:些结构记录了当前文件指针位置pos。File_read() file_write()分配是通过inode_read_at()和inode_write_at()实现的。二、 对disk_inode的改进 当前pintos文件系统限制很大。文件需要连续存储,这会导致大量磁盘碎片。文件大小固定,不能动态增长文件,只有一个目录
12、。这里主要把连续存储方式改为了linux中三级索引结构,而且可以动态增长文件,可以创建子目录。三级索引结构:01234567891011121314011是直接块,存入文件512128512128512128数据块扇区号。 12是一级索引13是二级索引Data51212851212814 是三级索引data512128如果一个物理块是512字节每个物理块中用四字节data直接块:12*512=6K一级索引:128*512=64K二级索引:128*128*512=8M三级索引:128*128*128*512=1GB总大小1GB8M72K通过修改struct disk_inode结构来实现三级索引
13、结构。修改过的disk_inodeStruct inode_disk Off_t length; /文件长度 Uint32_t blocksBLOCK_NUM; /三级索引区 Unsigned isdir; /此文件是不是目录Unsigned magic; Uint32_t unused110; ;修改inode_create()Inode_read_at()Inode_write_at()三个函数即可。空闲磁盘块依然用位图管理。可以用free_map_allocate()获得一个空闲物理块。用free_map_release()来释放物理块。只用写文件才有可能增长一个文件的大小。读写文件一般
14、是给出.1.改变了disk_inode, 自然要从inode_create开始入手。代码见附录。因为要区分目录和普通文件,所以对原来的inode_create进行了扩展,改为了bool inode_create_ex (block_sector_t sector, off_t length,uint32_t isdir);增加了isdir参数。重新定义了一个函数:bool inode_create(block_sector_t sector,off_t length) return inode_create_ex(sector,length,0);用这个来代替原来的inode_create。I
15、node_create执行时文件的disk_inode已经分配了,只需要分配文件数据空间,这里并不从free_map中分配空间,只是简单的把索引初始化为0。新创建的文件内容应为全0,所以调用了inode_write_at()来把文件内容写为全0;在写的过程中如果发现空间未分配,则会分配。2.读写文件 读写文件时会给出文件指针偏移offset和要读写的大小。需要根据offset来确定要读写的扇区,通过上面的公式可以计算出扇区号。计算代码见附录。定义如下结构:struct PosInfo uint16_t lev; /索引级别 uint32_t off; /数据扇区内部偏移 uint32_t sn
16、4; /sni表示i级索引块的扇区号 uint32_t np4;/npi表示i级索引块的偏移.;根据offset可以计算出offset在几级索引中-lev最后的数据块中的偏移 -off举例:如果offset=215364 size=865 buff=要从文件215364字节处读取865字节到buff中。经计算:Lev=2 Sn0=0 blocks15011121314Np0=13 Sn1=0Np1=2Sn2=0Np2=24由np0=13可以通过读取扇区blocksnp0到缓冲区arr512中去此时arr中就是一级索引块Arrnp1就是二级索引块的扇区号,由此又可以把二级索引块读入到arr中。
17、此时arr就是二级索引块,Arrnp2就是文件数据块的扇区号了,把数据块读入到arr中就可以对数据进行读写了。这个扇区读写完毕之后,offset也向后移动了x字节,这时又需要重新确定struct PosInfo结构。注意:写的时候,如果最后offset已经大小了文件长度,则认为扩展了文件长度,修改disk_inode中的文件长度。这就实现了文件的动态增长。3.inode删除需要收回文件空间,显然有了struct PosInfo结构,收回空间不是难事儿。代码见附录。三、多级目录的建立 现有目录只是根目录,而如今要实现多级目录,而且像linux系统一样,有一个环境变量pwd来存放当前目录。新目录支
18、持如: . ./ . ./ ././ /等操作,而且允许用户程序切换当前目录、打开目录、建立目录、读目录,都是通过系统调用system call实现的,以下列举了要实现的系统调用:(1)Bool chdir(const char *dir)切换当前目录。其中dir中可能有 /a/b/c/ ././c/d这样的字符串。需要字符串处理,最后打开目录,如果失败则切换失败,否则切换成功。(2)Mkdir(const char *dir)创建目录,如:/a/b/c 在/a/b/目录下建立c目录。调用附录中的DirCreate()创建目录。(3)readdir(int fd,char *name)将目录当
19、作普通文件来读,但是不能写。这使得file_write中判断一下,如果是目录则写入失败。(4)isdir(int fd)由文件句柄判断此文件是不是目录文件。可以根据disk_inode中的isdir变量来判断。(5)inumber返回一个数来区分是目录还是文件,通过在文件disk_inode变量区分,所以目录和文件可以统一分配空间。无论是切换目录还是创建目录,以及在目录下打开文件,创建文件,删除文件,都需要打开目录,要有一个目录字符串处理函数,于是char * MakePath(const char *from)应用而生。这个函数把pwd和from相结合,去掉其中./之类的符号,转化为标准的纯
20、绝对路径,如:/a/b/c/d /a/b/c/d/wyg.cpp。目录确定就能打开目录,struct dir *OpenDir(char *path,int *pos)函数来实现此功能。这又是一个字符串处理函数,可以用/作为区分。 无论是切换还是创建目录,都可以用打开目录来确定是否给出的目录合法。创建目录时,要指定disk_inode中的isdir为true. 在struct thread中加入指针char *pwd;来保存当前目录,使用时,如果pwd为NULL,则认为是根目录/;如果需要改变当前目录,则需要申请空间,线程退出时会释放掉空间。 删除目录时要注意,目录是否为空,可以逐个验证每个s
21、truct dir_entry中的bool use;变量来判断该目录下是否有目录或文件。 目录是在磁盘上的,磁盘是多个进程所共享的,对目录的操作也需要同步。主要在打开目录,删除目录时需要获得相应的锁。最简间的办法是给整个磁盘加锁,事实上允许一个进程操作某个文件或目录时允许其他进程也操作相同或者是不同的目录。所以打开目录后就释放锁。 四、buffer cache系统设计为了加快对磁盘的读写,在内存开辟出一定大小的空间作为磁盘缓冲区。于是需要设计一套缓冲系统。有的VM中的缓冲区设计的基础,设计这个就简单多了。分析pintos对块设备的读写可以发现,把有的外部块设备的读写都是通过block.c中的b
22、lock_read()函数和block_write()函数来实现的。在这两个函数中,在实际操作物理磁盘前,先在cache中查找要读写的块,如果在cache中,则直接从cache中读写,否则从磁盘调入cache再读写。这就有可能要从cache中淘汰出一个扇区。采用LRU算法可以有效的进行淘汰。具体实现:在内存开辟了64个扇区的空间作为cache.struct BlockCache size_t SecNo; /扇区号 bool Use; /该空间是否被占用 unsigned Num; /LRU中使用 bool Dirty; /该扇区有没有被写过 struct lock Lock;struct S
23、ec /一个扇区的空间 unsigned char data512;unsigned int PassTime=0;bool Inited=false;struct Sec SecArrCacheSize; /这里是64个扇区的空间struct BlockCache ManArrCacheSize; /每个扇区对应一个BlockCache结构,用于管理些扇区。(1)cache空间分配与回收在ManArr数组中,初始化为全未使用,当需要调入一个磁盘扇区时就可以依据Used变量找一个未使用的内存扇区。(2)使用情况统计每次读写磁盘时就把每个块的Num变量加1,当前读写的扇区的num清0.(3)需要
24、淘汰扇区时,选择num最大的,即最久未使用的扇区淘汰出去。(4)读写时就在ManArr中顺序查找要读写的块,找到就可以直接读写,否则需要从磁盘调入。(5)同步问题。磁盘缓冲系统出多线程共享,所以在调入调出时都需要同步。共享的是每个内存扇区,所以可以给每个扇区加一把锁,这就是BlockCache 中的lock的作用。(6)每隔一段时间需要把缓冲中的数据写回到磁盘上去,所以另创建了一个线程,这个线程每隔一定时间把cache中的块都写回到磁盘中去。附录中有cache的实现代码。五、Pintos 文件系统与外界的交换方法pintos如果把虚拟机外的文件复制到文件系统中的,又如何把把文件系统中的东西复制
25、到虚拟机外的?这是由filesys/ fsutil.c中的函数完成的。文件在pintos系统之外时被复制到了一个虚拟硬盘中,其格式是顺序结构。文件名等文件信息在一个扇区中,紧接着就是文件数据部分。其存储结构如下:上面一个方格代表一个扇区。Pintos启动前由外部程序把文件一个一个的按如上格式装入一个磁盘。Pintos启动后再从这个磁盘中读取文件,并在filesystem中建立相关的文件。文件1的文件头文件1的数据.文件2 的文件头数据.文件3附录:1.Inode create 代码:bool inode_create(block_sector_t sector,off_t length) re
26、turn inode_create_ex(sector,length,0);boolinode_create_ex (block_sector_t sector, off_t length,uint32_t isdir) struct inode_disk *disk_inode = NULL; bool success = false; ASSERT (length = 0); /* If this assertion fails, the inode structure is not exactly one sector in size, and you should fix that.
27、*/ ASSERT (sizeof *disk_inode = BLOCK_SECTOR_SIZE); disk_inode = calloc (1, sizeof *disk_inode); if (disk_inode != NULL) size_t sectors = bytes_to_sectors (length); disk_inode-length = length; disk_inode-isdir=isdir; disk_inode-magic = INODE_MAGIC; int i; for(i=0;iblocksi=0; success=true; static cha
28、r zerosBLOCK_SECTOR_SIZE; struct inode ie; ie.deny_write_cnt=0; ie.data=*disk_inode; for (i = 0; i sectors; i+) size_t minb=length512?length:512; inode_write_at(&ie,zeros,minb,i*512); /新文件,内容全0,写的 length-=512; /过程中会分配空间给文件。 *disk_inode=ie.data; block_write (fs_device, sector, disk_inode); /保存disk_in
29、ode free (disk_inode); return success;2.由文件偏移计算出所在扇区号:#define index0 (12*512)#define index1 (index0+128*512)#define index2 (index1+128*128*512)#define index3 (index2+128*128*128*512)struct PosInfo uint16_t lev; uint32_t off; uint32_t sn4; uint32_t np4;int GetPos(struct PosInfo *pi,off_t off) if(off=index3) return 1; if(off=index2) off-=index2; pi-lev=3; pi-sn0=0; pi-np0=14; pi-sn1=0; pi-np1=off/(128*128*512); off-=pi-np1*(128*128*512); pi-sn2=0; pi-np2=off/(128*512); off-=pi-np2*(128*512); pi-sn3=0; p
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1