1.2.2什么是分布式文件系统 引用“百度百科”中的描述: 为什么会有分布文件系统呢? 分布式文件系统是面对互联网的需求而产生,互联网时代对海量数据如何存储?靠简单的增加硬盘的个数已经满足 不了我们的要求,因为硬盘传输速度有限但是数据在急剧增长,另外我们还要要做好数据备份、数据安全等。 采用分布式文件系统可以将多个地点的文件系统通过网络连接起来,组成一个文件系统网络,结点之间通过网络进 行通信,一台文件系统的存储和传输能力有限,我们让文件在多台计算机上存储,通过多台计算共同传输。如下 图: 好处: 1、一台计算机的文件系统处理能力扩充到多台计算机同时处理。 2、一台计算机挂了还有另外副本计算机提供数据。 3、每台计算机可以放在不同的地域,这样用户就可以就近访问,提高访问速度。 1.3 主流的分布式文件系统 1、NFS 1)在客户端上映射NFS服务器的驱动器。 2)客户端通过网络访问NFS服务器的硬盘完全透明。 2、GFS 1)GFS采用主从结构,一个GFS集群由一个master和大量的chunkserver组成。 2)master存储了数据文件的元数据,一个文件被分成了若干块存储在多个chunkserver中。 3)用户从master中获取数据元信息,从chunkserver存储数据。 3、HDFS 1)HDFS采用主从结构,一个HDFS集群由一个名称结点和若干数据结点组成。 名称结点存储数据的元信息,一个完整的数据文件分成若干块存储在数据结点。 2)客户端从名称结点获取数据的元信息及数据分块的信息,得到信息客户端即可从数据块来存取数据。 1.4分布式文件服务提供商 1)阿里的OSS 2)七牛云存储 3)百度云存储