当前位置: 开发笔记 > 运维 > 正文

yale_OS(7)——xv6中的文件系统(FileSystem)

作者：四川im__miki | 来源：互联网 | 2023-05-17 14:34

一、概述文件系统的作用：组织和存储数据。文件系统的特性：1）支持在用户和应用中间共享数据；2）数据持久存在，当系统重启后，数据仍然可用。xv6文件系统提供类Unix的

一、概述

文件系统的作用：组织和存储数据。

文件系统的特性：

1）支持在用户和应用中间共享数据；

2）数据持久存在，当系统重启后，数据仍然可用。

xv6文件系统提供类Unix的文件（files）、目录（directory）、路径（pathnames），持久保存数据在IDE磁盘上。

那么文件系统主要解决如下几个难题：

1）文件系统需要磁盘上的数据结构来表示命名的目录和文件的树结构，来记录保存各个文件内容的块身份，同时记录磁盘上哪些块是空闲的。

2）文件系统必须支持故障修复功能（crash recovery），就是说，如果有故障产生（如掉电），那么重启后，文件系统必须仍能正确的工作。存在的风险就是故障可以中断一些列的更新和让磁盘上的数据结构不一致（例如，块（block）同时被一个文件使用和标志为空闲）。

3）不同的进程可能会在同一时间操作文件系统，因此必须协调好来维持不变。

4）访问磁盘比访问内存慢几个数量级，因此文件系统必须维持一个常用块（block）的内存中cache。

xv6文件系统的实现按6层来组织，如下图所示：

图1 xv6文件系统的的层结构

Buffer cache层的作用是：通过Buffer cache来对IDE磁盘上的块（blocks）进行读写，当同时访问一磁盘块时，必须确保每一次只有一个内核进程可以编辑存储在仍能块上的文件系统数据。

Logging层允许较高层在事务处理时打包一些块的更新，以确保这些块能原子地被更新。（例如，他们都被更新或都不更新）。

Inodes和Block Allocator层：提供未命名的文件，各个用一个inode和保存文件数据的一系列块来表示。

Directory inodes层：实现目录作为一些特殊类型的inode，其内容是一系列的目录进入点，各个包含一个名字和命名的文件inode 的引用。

Recursive lookup提供多层次的路径名，像/usr/rtm/xv6/fs.c，使用循环查询

File Descriptors层：使用文件系统接口来抽象很多的Unix资源（像，Pipe，Devices，Files等等），来简化应用程序员的工作。

文件系统必须安排好在磁盘上哪里存储inodes和内容块。为此，xv6把磁盘分为几个分区（sections）。如下图2所示，文件系统不适用block 0（其中保存的是boot sector），block 1被称为superblock，它包含文件系统的元数据（metadata）（块中文件系统大小，数据块数目，inodes数目，在log中块数据）。块（blocks）从2开始保存inodes，伴随每一个block有多有inodes。随后是bitmap块用来跟踪哪些块在使用。剩下来的大多部分块是数据块，其中保存的是文件和目录内容。磁盘的末尾块保存一log，其是transaction层的一部分。

图2 xv6文件系统结构。

在头文件fs.h中包含了描述文件系统具体鞥的常量和数据结构。如下：

// On-disk file system format. 
// Both the kernel and user programs use this header file.

// Block 0 is unused.
// Block 1 is super block.
// Blocks 2 through sb.ninodes/IPB hold inodes.
// Then free bitmap blocks holding sb.size bits.
// Then sb.nblocks data blocks.
// Then sb.nlog log blocks.

#define ROOTINO 1  // root i-number
#define BSIZE 512  // block size

// File system super block
struct superblock {
  uint size;         // Size of file system image (blocks)
  uint nblocks;      // Number of data blocks
  uint ninodes;      // Number of inodes.
  uint nlog;         // Number of log blocks
};

#define NDIRECT 12
#define NINDIRECT (BSIZE / sizeof(uint))
#define MAXFILE (NDIRECT + NINDIRECT)

// On-disk inode structure
struct dinode {
  short type;           // File type
  short major;          // Major device number (T_DEV only)
  short minor;          // Minor device number (T_DEV only)
  short nlink;          // Number of links to inode in file system
  uint size;            // Size of file (bytes)
  uint addrs[NDIRECT+1];   // Data block addresses
};

// Inodes per block.
#define IPB           (BSIZE / sizeof(struct dinode))

// Block containing inode i
#define IBLOCK(i)     ((i) / IPB + 2)

// Bitmap bits per block
#define BPB           (BSIZE*8)

// Block containing bit for block b
#define BBLOCK(b, ninodes) (b/BPB + (ninodes)/IPB + 3)

// Directory is a file containing a sequence of dirent structures.
#define DIRSIZ 14

struct dirent {
  ushort inum;
  char name[DIRSIZ];
};

接下来，详细学习各层的实现原理，

二、文件系统中各层原理以及代码实现

1、Buffer Cache层

buffer cach原理

buffer cache有两个功能：1）同步访问磁盘块，确保只有一个块的copy在内存中，同时一次也就一个内核线程使用该copy。

2）cache常用块，这样他们就不需要从比较慢的磁盘中重新读取，代码在bio.c中

buffer cache的主要接口有bread和bwrite组成。

bread获得包含块copye的buffer。该buffer可以读，也可以在内存中修改。

bwrite写修改后的buffer 到内存中的适合的块中。

当任务完成后，内核线程必须通过调用brelse来释放buffer。

当buffer cache同步访问各个块，顶多允许一个内核线程引用块的buffer。如果一个内核线程已经获得引用buffer的权限，但是还没有释放，那么其他的线程调用bread来读取相同的块时需要等待。较高层的文件系统依赖buffer cache的块同步来帮助他们维持不变。

buffer cache有固定的buffer号来保存磁盘块，意味着如果一个文件系统请求的块已经不在cache中，那么buffer cache必须重新循环当前的buffer来保存一些其他的块。buffer cache重循环最近最少使用的buffer用于保存新的块。该假设是最近最少使用的buffer，再次使用的可能性最小。

buffer cache代码实现

buffer cache是一个buffer的双链表。内核中main函数通过调用binit函数来对NBUF（=10）个buffer的静态数组buf进行初始化链表。所有其他访问buffer cache通过bcache.head来应用链表，而不是buf数组。

buffer有三个状态bits与其关联，如下：

1）B_VALID：表示buffer包含有效的块copy。

2）B_DIRTY：表示buffer内容已经被修改，需要被写入磁盘。

3）B_BUSY：表示一些内核线程引用该buffer，还没有释放。

binit函数的实现代码如下：

void
binit(void)
{
  struct buf *b;

  initlock(&bcache.lock, "bcache");

//PAGEBREAK!
  // Create linked list of buffers
  bcache.head.prev = &bcache.head;
  bcache.head.next = &bcache.head;
  for(b = bcache.buf; b     b->next = bcache.head.next;
    b->prev = &bcache.head;
    b->dev = -1;
    bcache.head.next->prev = b;
    bcache.head.next = b;
  }
}

其中buf结构体和bcache的定义如下：

struct {
  struct spinlock lock;
  struct buf buf[NBUF];

  // Linked list of all buffers, through prev/next.
  // head.next is most recently used.
  struct buf head;
} bcache;

// the definition of  struct buf
struct buf {
  int flags;
  uint dev;
  uint sector;
  struct buf *prev; // LRU cache list
  struct buf *next;
  struct buf *qnext; // disk queue
  uchar data[512];
};
#define B_BUSY  0x1  // buffer is locked by some process
#define B_VALID 0x2  // buffer has been read from disk
#define B_DIRTY 0x4  // buffer needs to be written to disk

bread函数调用bget函数获得给定sectors的buffer。如果该buffer需要从磁盘上读取，则在返回buffer之前，bread函数调用iderw函数来读取。

struct buf*
bread(uint dev, uint sector)
{
  struct buf *b;

  b = bget(dev, sector);
  if(!(b->flags & B_VALID))
    iderw(b);
  return b;
}

bget函数根据给定的设备和扇区号来扫描buffer链表，如果有一个buffer空闲，bget设置其B_BUSY标志位然后返回，如果buffer已经处于使用中，bget函数sleep等待其释放。当sleep返回后，bget函数不能假定该buffer已经可用，实际上，从sleep释放，然后重新获取buf_table_lock，不能确保b仍然是正确的buffer：可能已经被重新用为不同的磁盘扇区。bget函数没有选择，必须重新开始。以希望这次的结果不同。

bget函数的代码实现如下：

// Look through buffer cache for sector on device dev.
// If not found, allocate fresh block.
// In either case, return B_BUSY buffer.
static struct buf*
bget(uint dev, uint sector)
{
  struct buf *b;

  acquire(&bcache.lock);

 loop:
  // Is the sector already cached?
  for(b = bcache.head.next; b != &bcache.head; b = b->next){
    if(b->dev == dev && b->sector == sector){
      if(!(b->flags & B_BUSY)){
        b->flags |= B_BUSY;
        release(&bcache.lock);
        return b;
      }
      sleep(b, &bcache.lock);
      goto loop;
    }
  }

  // Not cached; recycle some non-busy and clean buffer.
  for(b = bcache.head.prev; b != &bcache.head; b = b->prev){
    if((b->flags & B_BUSY) == 0 && (b->flags & B_DIRTY) == 0){
      b->dev = dev;
      b->sector = sector;
      b->flags = B_BUSY;
      release(&bcache.lock);
      return b;
    }
  }
  panic("bget: no buffers");
}

如果bget函数没有goto操作，那么就会发生图3所示的竞争。

图3 竞争导致进程3收到包含块4的buffer，尽管其请求的是块3

第一个进程有一buffer，然后加载扇区3到其中，现在有其他两个进程到来，这两个进程中，一个要获得buffer 3，在循环中sleeps等待cached blocks，另一个要获得buffer 4，同时sleep

文件
unix

推荐阅读

linux
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
linux
深入解析网络存储技术

本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储（DAS）、网络附加存储（NAS）和存储区域网络（SAN）的特点，帮助读者理解不同存储方式的优势与局限性。 ... [详细]

蜡笔小新 2024-12-24 10:38:34
linux
Linux中Diff命令的详细使用指南

本文介绍Linux中的Diff命令，该命令用于逐行对比两个文本文件，展示它们之间的差异。通过系统性检查，它能有效标识出文件间所有不同的行，无需事先对文件进行排序。 ... [详细]

蜡笔小新 2024-12-23 14:53:00
unix
C语言的起源与发展历程

本文详细介绍了C语言的起源、发展及其标准化过程，涵盖了从早期的BCPL和B语言到现代C语言的演变，并探讨了其在操作系统和跨平台编程中的重要地位。 ... [详细]

蜡笔小新 2024-12-23 14:11:43
linux
SaltStack部署实践（4）JOB管理与Returns模块

目录一、salt-job管理#job存放数据目录#缓存时间设置#Others二、returns模块配置job数据入库#配置returns返回值信息#mysql安全设置#创建模块相关 ... [详细]

蜡笔小新 2024-12-22 18:53:43
unix
Vim编辑器基础命令与模式详解

本文详细介绍了Vim编辑器的三种主要模式及其常用命令，帮助用户更好地掌握这一强大的文本编辑工具。 ... [详细]

蜡笔小新 2024-12-22 13:43:58
sudo
无屏幕环境下树莓派4B的安装与配置指南

本文将详细介绍如何在没有显示器的情况下，使用Raspberry Pi Imager为树莓派4B安装操作系统，并进行基本配置，包括设置SSH、WiFi连接以及更新软件源。 ... [详细]

蜡笔小新 2024-12-21 08:14:50
linux
UNIX进程间通信（IPC）详解

本文深入探讨了UNIX/Linux系统中的进程间通信（IPC）机制，包括消息传递、同步和共享内存等。详细介绍了管道（Pipe）、有名管道（FIFO）、Posix和System V消息队列、互斥锁与条件变量、读写锁、信号量以及共享内存的使用方法和应用场景。 ... [详细]

蜡笔小新 2024-12-20 10:14:51
unix
Python面试题精粹

本文档汇总了Python编程的基础与高级面试题目，涵盖语言特性、数据结构、算法以及Web开发等多个方面，旨在帮助开发者全面掌握Python核心知识。 ... [详细]

蜡笔小新 2024-12-19 20:26:25
linux
配置SecureCRT以显示Linux终端颜色

本文介绍如何配置SecureCRT以正确显示Linux终端的颜色，并解决中文显示问题。通过简单的步骤设置，可以显著提升使用体验。 ... [详细]

蜡笔小新 2024-12-19 18:30:14
apache
Google排名优化－面向Google(Search Engine Friendly)的URL设计

Google排名优化－面向Google(Search Engine Friendly)的URL设计 ... [详细]

蜡笔小新 2024-12-19 16:16:50
linux
深入解析Java命令行参数及其应用

本文详细探讨了Java命令行参数的概念、使用方法及在实际编程中的应用，包括如何通过命令行传递参数给Java程序，以及如何在Java程序中解析这些参数。 ... [详细]

蜡笔小新 2024-12-19 14:54:34
linux
C语言编程常用工具推荐

俗话说得好，“工欲善其事，必先利其器”。这句话不仅强调了工具的重要性，也提醒我们在任何项目开始前，准备合适的工具至关重要。本文将介绍几款C语言编程中常用的工具，帮助初学者更好地选择适合自己学习和工作的编程环境。 ... [详细]

蜡笔小新 2024-12-19 14:09:36
linux
深入理解动态链接库及其应用

本文将探讨动态链接库的基本概念，包括Windows下的动态链接库（DLL）和Linux下的共享库（Shared Library），并详细介绍如何在Linux环境中创建和使用这些库。 ... [详细]

蜡笔小新 2024-12-19 09:08:40
linux
Linux下NFS客户端配置详解

NFS（Network File System）即网络文件系统，是一种分布式文件系统协议，主要用于Unix和类Unix系统之间的文件共享。本文详细介绍NFS的配置文件/etc/exports和相关服务配置，帮助读者理解如何在Linux环境中配置NFS客户端。 ... [详细]

蜡笔小新 2024-12-18 18:23:35

四川im__miki

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章