热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

MongoDB数据库使用经验

MongoDB的单进程,多线程模型读操作可以使用多线程,利用多核心;写操作(GlobalLocking)和Map-reduce(JS解释器的限制)只能使用单线程。从2.2版本,MongoDB部分解决了全局锁问题,可以在写某个库的时候同时写其他库。一般通过在多核心单机上Shard

MongoDB 的单进程,多线程模型

读操作可以使用多线程,利用多核心;写操作(Global Locking)和 Map-reduce(JS 解释器的限制)只能使用单线程。

从2.2 版本,MongoDB 部分解决了全局锁问题,可以在写某个库的时候同时写其他库。一般通过在多核心单机上 Sharding 数据库,使用多个 mongod instance, 通过利用多核和缓解全局锁的问题提高读写操作 ops。可以通过 mongostat 命令查看 locking 和 page fault 情况。

另外,使用 htop 可以看到一个进程中的多个线程。Node.js 每个进程其实有两个线程,除了主线程外,还有一个线程池用来处理文件读写等操作。

充分利用 MongoDB 的 oplog

MongoDB 通过 oplog 实现主从同步,但是即使不启用从库,也可以查看和使用 oplog。修改配置文件打开 oplog:

/etc/mongod.conf
# Replication Options
master = true

这样就会在 local database 出现一个名为 oplog.$main 的 collection,(一般 MongoDB 会将这个 collection 中的数据条数保持在 5000 万以下),其中数据类似于:

{
   "ts": {
     "t": ,
     "i":
  },
   "op": "u",
   "ns": "mydb.mycoll",
   "o2": {
     "_id": ObjectId("50a6718e50e50b4459dcc40e")
  },
   "o": {
     "$set": {
       "myfield": "myfield_value"
    }
  }
}

ts 为自定义的时间戳
op 表示操作类型: insert (i), update (u), delete (d), noop (n)
ns 为操作对应的 collection
o 为操作数据,这里为 $set 操作修改记录

MongoDB 的 MMAP 内存模型

MMAP 的一个缺点很多,比如当读取数据没有在内存中,操作遇到 page fault 的时候也会发生锁操作。

MongoDB 的索引

MongoDB 支持简单的 B-Tree 索引。默认情况下 _id 会自动建索引,如果需要查询其他字段可以自己手动建索引(ensureIndex() )。另外,注意在数据导入导出的时候重建索引。
比 MySQL 好的是 MongoDB 支持多值索引,即使两个字段的顺序是相反的。比如可以支持 .sort({a:1, b:-1}) 这样按不同字段的排序。和 MySQL 类似,使用的时候同样需要避免类似于 skip(BIG_NUM).limit(N) 这样的操作。

MongoDB 需要注意的几点 1. 对线上库的批量操作要控制频率

假如某些读写操作不断占用数据库资源,其他操作将不能很快或者正确完成。可以通过 sleep 操作降低批量操作的频率,为其他操作提供执行空隙。

2. 实时将数据同步到关系型数据库支持复杂查询和数据分析

NoSQL 不支持复杂查询,但是如果需要复杂查询和数据分析,可以将数据同步到关系型数据库中。

MongoDB 原生支持 Streaming,以下 Node.js 代码可以实时获取某个 collection 的数据变化,可以同步到关系型数据库,也可以用来做 Trigger。以下是 MognoDB tail oplog 的核心代码(Node.js):

var options = {
  'ns': self.config.mongodb.db + '.' + self.config.mongodb.collection,
  'ts': {'$gt': new mongo.Timestamp.fromNumber(this.last_timestamp)}
};
var stream = this.mongo.db.collection('oplog.$main')
    .find(options, {tailable: true, awaitdata: true, numberOfRetries: -}).stream();
stream.on('data', function(item) {
  if (item.op !== 'n' && item.ts.toNumber() !== self.last_timestamp) {
    console.log(adate() + ' ' + JSON.stringify(item)+'\r\n');
    self.process(item, function() {
    });
  }
});

注意读写压力很大的情况下控制 streaming 的速度,具体情况可以见前一篇博文: Node.js 调试 GC 以及内存暴涨的分析。相关代码:

  var stream = this.mongo.db2.collection(self.config.mongodb.collection).find().stream();
  stream.on("data", function(item) {
    stream.pause();
    //console.log(JSON.stringify(item)+'\r\n');
    self.mysql.insert(item, function() {
      stream.resume();
    });
  });
3. 需要为 MongoDB 提供足够的内存空间

如果数据库的数据没有冷热之分,最好配置大于数据大小的内存,防止频繁磁盘操作。
通过将数据记录的键值改短也能明显节约空间。

4. MongoDB 默认操作的异步特性

MongoDB 写操作默认情况下是异步的,所以为了保持一致性,需要加上选项:

{
  safe: {
    fsync: true
  }
}
总之

MongoDB 是一个非常易用,优点和缺点都很明显的数据库。在某些场景下,可以考虑使用 TC,Redis 或者 Postgres,MySQL 替代。


推荐阅读
  • 本文介绍了如何使用Workman框架构建一个功能全面的即时通讯系统,该系统不仅支持一对一聊天、群组聊天,还集成了视频会议和实时音视频通话功能,同时提供了红包发送等附加功能。 ... [详细]
  • 构建高性能Feed流系统的设计指南
    随着移动互联网的发展,Feed流系统成为了众多社交应用的核心组成部分。本文将深入探讨如何设计一个高效、稳定的Feed流系统,涵盖从基础架构到高级特性的各个方面。 ... [详细]
  • Redis:缓存与内存数据库详解
    本文介绍了数据库的基本分类,重点探讨了关系型与非关系型数据库的区别,并详细解析了Redis作为非关系型数据库的特点、工作模式、优点及持久化机制。 ... [详细]
  • MongoDB核心概念详解
    本文介绍了NoSQL数据库的概念及其应用场景,重点解析了MongoDB的基本特性、数据结构以及常用操作。MongoDB是一个高性能、高可用且易于扩展的文档数据库系统。 ... [详细]
  • MySQL Decimal 类型的最大值解析及其在数据处理中的应用艺术
    在关系型数据库中,表的设计与SQL语句的编写对性能的影响至关重要,甚至可占到90%以上。本文将重点探讨MySQL中Decimal类型的最大值及其在数据处理中的应用技巧,通过实例分析和优化建议,帮助读者深入理解并掌握这一重要知识点。 ... [详细]
  • 择要:Fundebug的JavaScript毛病监控插件同步支撑Vue.js异步毛病监控。Vue.js从降生至今已5年,尤大在本年2月份宣布了严重更新,即Vue2.6。更新包含新增 ... [详细]
  • MySQL 8.0 新特性详解:免费视频教程上线
    本文介绍了一套在慕课网上发布的免费视频教程,深入解析 MySQL 8.0 的核心新功能,包括增强的安全性、用户管理、新的索引类型、CTE 和窗口函数等。 ... [详细]
  • 本文详细记录了一位Java程序员在Lazada的面试经历,涵盖同步机制、JVM调优、Redis应用、线程池配置、Spring框架特性等多个技术点,以及高级面试中的设计问题和解决方案。 ... [详细]
  • Docker基础入门与环境配置指南
    本文介绍了Docker——一款用Go语言编写的开源应用程序容器引擎。通过Docker,用户能够将应用及其依赖打包进容器内,实现高效、轻量级的虚拟化。容器之间采用沙箱机制,确保彼此隔离且资源消耗低。 ... [详细]
  • 本文档旨在为初学者提供MongoDB的基础知识介绍,包括其作为文档型数据库的特点、基本概念以及如何通过命令行界面(CLI)执行基本的操作。 ... [详细]
  • 本文介绍了如何使用Node.js通过两种不同的方法连接MongoDB数据库,包括使用MongoClient对象和连接字符串的方法。每种方法都有其特点和适用场景,适合不同需求的开发者。 ... [详细]
  • 实践指南:使用Express、Create React App与MongoDB搭建React开发环境
    本文详细介绍了如何利用Express、Create React App和MongoDB构建一个高效的React应用开发环境,旨在为开发者提供一套完整的解决方案,包括环境搭建、数据模拟及前后端交互。 ... [详细]
  • PHP面试题精选及答案解析
    本文精选了新浪PHP笔试题及最新的PHP面试题,并提供了详细的答案解析,帮助求职者更好地准备PHP相关的面试。 ... [详细]
  • 本打算教一步步实现koa-router,因为要解释的太多了,所以先简化成mini版本,从实现部分功能到阅读源码,希望能让你好理解一些。希望你之前有读过koa源码,没有的话,给你链接 ... [详细]
  • 本文介绍了多种开源数据库及其核心数据结构和算法,包括MySQL的B+树、MVCC和WAL,MongoDB的tokuDB和cola,boltDB的追加仅树和mmap,levelDB的LSM树,以及内存缓存中的一致性哈希。 ... [详细]
author-avatar
手机用户上官婉儿
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有