作者:eyk0256912 | 来源:互联网 | 2014-05-28 16:53
最近抽出点时间,总结下mongodb知识,写个系统专题供网友们参考学习。mongodb介于关系型数据库和非关系型数据库之间,mongodb势头很火的,许多公司都在使用这款数据库,某些公司将mysql数据库转换到mongodb数据库上。Cassandra、Couchbase和HBase是MongoDB三
最近抽出点时间,总结下mongodb知识,写个系统专题供网友们参考学习。mongodb介于关系型数据库和非关系型数据库之间,mongodb势头很火的,许多公司都在使用这款数据库,某些公司将mysql数据库转换到mongodb数据库上。Cassandra、Couchbase和HBase是MongoDB三大竞争对手。
一. mongodb介绍
1. mongodb主要特性
a.模式自由,支持动态查询,全文索引(2.4版本开始支持),方便查询文档中的对象和数组
b.文档存储类型
c.高效的数据存储,支持二进制数据以及大型对象如视频、图片等
d.多种架构,支持复制,故障恢复
e.自动分片
f.高度伸缩性,可动态添加服务器
2. mongodb适用场景
a.持久化缓存层
b.实时数据存储
c.BSON数据格式非常适合文档化格式的存储和查询
d.数十台或上百台的数据库集群
3. mongodb不适用场景
a. 高度事务性系统
b. 商业智能应用
c. 复杂的跨表级联查询
二. mongodb工作方式
1. mongodb使用内存映射文件进行数据管理。把所有空闲内存当缓存使用,而且不能指定内存大小。
2.
mongodb数据空间采用预分配。为每个数据库分配一系列文件,每个数据文件预分配一个大小,第一个文件名字为xxx.0,大小64M,第二个文件名字为xxx.1,大小128M,第三个文件名字为xxx.2,大小为256M,以此类推。在32位系统下支持的最大文件为2G。随着数据量的递增,在数据库工作目录下会看到不断递增的文件。
3.
mongodb没有自增序列。mongodb中存储的文档必须要有一个_id键,这个值可以是任何类型的,默认是objectid对象。当BSON对象插入到数据库时,会自动生成一个objectid对象作为_id插入到集合中作为该文档的主键。在一个集合里,每个文档都有唯一的_id值,来确保集合里每个文档都能被唯一标识。如果有两个集合的话,两个集合都可以有一个值为123的_id键,但每个集合里只能有一个_id是123的文档。_id值由4字节的时间戳,3字节的机器号,2字节的进程id和3自己的自增计数组成。_id值也可以手工生成,只要确保唯一性即可。
4. 每个插入的BSON对象大小不能超过4M,否则需要使用GridFS来存储。
5.
删除数据后不会释放空间。为了避免数据的大规模移动,原记录空间不删除,只标记已删除,可以重复利用。如果为了收回空间可以进行repair操作,不过特别注意这个操作需要锁表的。
6. use database_name时,并不产生新的数据库,只有插入文档时产生。
三. mongodb数据类型
mongodb支持基本的数据类型string、integer、boolean、double、null、array、object。除外还支持date、objectid、binary
data、regular expression、code数据类型。
四. mongodb命令规则
1. 集合名不能为空
2. 集合名不能含有空字符,空字符表示集合名的结尾
3.
集合名不能以system.开头。system为系统保留的。system.users这个集合保存数据库的用户信息,system.namespaces保存着所有数据库集合的信息,system.indexes索引文件,system.profile数据库的相关信息
4. 用户创建的集合名字不能含有保留字符$
五. 数据库
1. 数据库命名规则
a. 不能是空字符串
b. 不能含有‘’,空格,.,$,/,\,空字符
c. 应全部小写
d. 最多64个字节
2. 特殊数据库
a. admin
root数据库,用户添加到这个数据库,同时一些特定的命令也只能从这个数据库运行,比如列出所有数据库或关闭数据库(需要在启用验证模式下)
b. local
这个数据库永远不会被复制,用来存储限于本地服务器的集合。
c. config
用于保存分片的相关信息。
六. mongodb驱动连接
格式如下:
mongodb://[username:password@]host1[:port1][,host2[:port2],…[,hostN[:portN]]][/[database][?options]]
说明:
mongodb:// 标示标准连接方式
username:password 可选的,连接mongodb的用户名和密码
hostX 要连接的服务器ip
portX 要连接的服务器端口
/database 要登录的数据库名
?options 连接可选选项,采用kv方式,每对kv值用&或;分割
?options项有:
1. Replica set
replicaSet=name
驱动程序将验证连接的replicaset的名字与name是否相匹配,意味着指定的主机地址,都可以连接replicaSet中所有的成员。
2. Single server
slaveOk=true|false true从可以读。默认情况下从不可写不可读的。
3.其他设置
a. safe=true|false
true为了保证更新成功,驱动程序将每次更新后发送getLastError命令。默认是false。
b. w=n
mongodb集群中,n台服务器成功写入算更新成功。设置了此项后,safe=true隐式启用。
c. wtimeoutMS=ms
写超时时间。设置了此项后,safe=true隐式启用。
d. fsync=true|false
true: 每次更新完后进行fsync操作确保数据刷新到磁盘上。设置了此项后,safe=true隐式启用。
e. journal=true|false
true: Sync to journal。设置了此项后,safe=true隐式启用。
d. cOnnectTimeoutMS=ms
连接超时时间。
e. socketTimeoutMS=ms
socket连接超时时间。
实例如下:
mongodb://localhost
mongodb://user:password@localhost
mongodb://user:password@localhost/database
mongodb://example1.com:27017,example2.com:27017
mongodb://localhost,localhost:27018,localhost:27019
mongodb://host1,host2,host3/?slaveOk=true
mongodb://localhost/?safe=true
mongodb://host1,host2,host3/?safe=true;w=2;wtimeoutMS=2000
mongodb://rs1.example.com:27017,rs2.example.com:27017/?replicaSet=myReplSetName
mongodb://localhost/?journal=true&w=majority&wTimeoutMS=20000
PHP驱动连接实例:
$m = new MongoClient("mongodb://localhost/?journal=true&w=majority&wTimeoutMS=20000");
$m = new MongoClient("mongodb://rs1.example.com:27017,rs2.example.com:27017/?replicaSet=myReplSetName"));
$m = new MongoClient("mongodb://rs1.example.com:27017", array("replicaSet" => "myReplSetName"));
$m = new MongoClient("mongodb://rs1.example.com:27017,rs2.example.com:27017", array("replicaSet" => "myReplSetName","wTimeoutMS"=>20000));