作者:249126059_a32331 | 来源:互联网 | 2014-05-28 16:53
GridFS是一种将大型文件存储在MongoDB数据库中的文件规范。所有官方支持的驱动均实现了GridFS规范。1为什么要用GridFS由于MongoDB中BSON对象大小是有限制的,所以GridFS规范提供了一种透明的机制,可以将一个大文件分割成为多个较小的文档,这样
GridFS 是一种将大型文件存储在 MongoDB
数据库中的文件规范。所有官方支持的驱动均实现了 GridFS 规范。
1 为什么要用 GridFS
由于 MongoDB 中 BSON 对象大小是有限制的,所以 GridFS
规范提供了一种透明的机制,可 以将一个大文件分割成为多个较小的文档, 这样的机制允许我们有效的保存大文件对象, 特
别对于那些巨大的文件,比如视频、高清图片等。
2 如何实现海量存储
规范指定了一个将文件分块的标准。 每个文件都将在文件集合对象中保存一
个元数据对象,一个或多个 chunk 块对象可被组合保存在一个 chunk 块集合中。
3 简单介绍
GridFS 使用两个表来存储数据: files(包含元数据对象
)和chunks(包含其他一些相关信息的二进制块 )。
为了使多个 GridFS 命名为一个单一的数据库,文件和块都有一个前缀,默认情况下,前缀 是 fs,所以任何默认的 GridFS
存储将包括命名空间 fs.files 和 fs.chunks。各种第三方语言的 驱动有权限改变这个前缀,所以你可以尝试设置另一个
GridFS 命名空间用于存储照片,它 的具体位置为:photos.files 和 photos.chunks。
4 命令行工具
mongofiles 是从命令行操作 GridFS 的一种工具 。
查一下看库里有哪些 GridFS 文件,在”mongofiles”后加一个参数”list”即可
接下来我们进库里看一下是否有新的东西。show collections。
查看 fs.files 中的内容
fs.files 中存储的是一些基础的元数据信息:
Filename: 存储的文件名
chunkSize: chunks 分块的大小
uploadDate: 入库时间
md5: 此文件的 md5 码
length: 文件大小, 单位”字节”
查看 fs.chunks 中的内容
其中n,它代表的是 chunks 的序号,此序号从 0 开始。
取出文件:./mongofiles get testfile,并用md5sum testfile
验证md5值是否与库中相同。
7.6 索引
db.fs.chunks.ensureIndex({files_id:1, n:1}, {unique: true});
这样,一个块就可以利用它的 files_id 和 n 的值进行检索。注意,GridFS 仍然可以用 findOne
得到第一个块,如下:
db.fs.chunks.findOne({files_id: myFileID, n: 0});