热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

mongodb主键_MongoDB主键是您的朋友

mongodb主键MongoDB集合中的所有文档都有一个主键,称为_id。该字段在插入后自动分配给文档,因此几乎不需要提供它。_id字段有趣的是

mongodb 主键

MongoDB集合中的所有文档都有一个主键,称为_id 。 该字段在插入后自动分配给文档,因此几乎不需要提供它。 _id字段有趣的是,它是基于时间的 。 也就是说, _id的基础类型为ObjectId ,是12字节的BSON类型 ,其中的4个字节表示自Unix时代以来的秒数。

_id字段的特殊之处在于,它会通过在任何集合上调用getIndexes来自动建立索引,如下所示。

所有MongoDB集合都有一个_id字段作为索引:

> db.things.getIndexes()
[{"v" : 1,"key" : {"_id" : 1},"ns" : "test.things","name" : "_id_"}
]

就像每个人都记得传统RDBMS一样, 索引很重要,因为它们可以使文档检索更快。 但是,索引确实会占用内存,并且在插入文档时会稍微降低性能,因为必须更新所有相应的索引。 因此,尽管您应该认真考虑使用索引,但是在使用索引时需要经济。

自然地,仅当您知道文档的_id时才进行搜索。 通常会通过其他字段来搜索文档,如果您发现自己是通过时间序列 (例如created_at进行搜索的,那么您就来了。

想象一个称为logs的集合,其中包含捕获各种日志消息的简单文档。 示例文档如下所示:

日志收集中的一个简单文档:

{"_id" : ObjectId("51c4ab6d4d6906d494460728"),"message" : "crashed, no such method exception","type" : "crash","created_at" : ISODate("2013-06-21T19:37:17.992Z")
}

如果我想查找某个日期(例如今天)的所有日志消息怎么办? 我可以这样写查询:

查找自2013年6月20日以来创建的所有日志:

db.logs.find({created_at:{'$gt': new Date(2013, 5, 20)}})

如果我对该查询进行解释,则可以看到,因为我在created_at上没有索引,因此可以利用基本游标,并且扫描了集合中的所有文档以检索结果。

我的发现附有一个解释计划:

> db.logs.find({created_at:{'$gt': new Date(2013, 5, 20)}}).explain()
{"cursor" : "BasicCursor","isMultiKey" : false,"n" : 2,"nscannedObjects" : 4,"nscanned" : 4,"nscannedObjectsAllPlans" : 4,"nscannedAllPlans" : 4,"scanAndOrder" : false,"indexOnly" : false,"nYields" : 0,"nChunkSkips" : 0,"millis" : 0,"indexBounds" : {},"server" : "ghome-computer.home:27017"
}

如您所见,通过created_at字段进行搜索可能效率不高; 因此,您可能很想在该字段上添加索引。 这自然会使该特定查询效率更高,但是,您将招致新索引的开销,这将消耗更多的内存,并且由于对该新创建的索引进行了更新,因此插入操作会稍微慢一些。

事实证明,由于_id字段在其中嵌入了Unix纪元,因此无需包含created_at字段,就可以轻松地编写find表达式。 例如, MongoDB Ruby驱动程序允许您从类似这样的Time创建ObjectId :

通过from_time工厂方法创建一个新的ObjectId:

yesterday = Time.now - (60*60*(24*1))
custom_id = BSON::ObjectId.from_time(yesterday)
=> BSON::ObjectId('51c397800000000000000000')

如您所见,我通过from_time工厂方法创建了一个新的ObjectId 。 51c397800000000000000000是十六进制表示形式,前8位数字表示时间,其他所有内容均清零。

现在,我可以在任何find表达式中使用我的custom_id了。 通过Ruby驱动程序,我还可以将一个explain ,which'll展示自由的使用_id索引。

使用派生日期的ObjectId强制查找使用_id索引:

mongodb[:logs].find({_id: {'$gt' => custom_id}}).explain=> {"cursor"=>"BtreeCursor _id_", "isMultiKey"=>false, "n"=>1, "nscannedObjects"=>1, "nscanned"=>1, ....}

如果看到BtreeCusor ,则表明您正在使用索引; 如果看到BasicCursor ,那么您知道不是。

因此,如果您发现自己正在执行查询并为诸如created_at之类的某个时间或日期字段创建索引,那么最好只使用Mongo的_id字段,因为它已经嵌入了创建于at的概念,并且默认情况下已被索引。 数字?

参考: The Disco Blog博客上的MongoDB主键是我们JCG合作伙伴 Andrew Glover的朋友 。

翻译自: https://www.javacodegeeks.com/2013/06/mongodb-primary-keys-are-your-friend.html

mongodb 主键



推荐阅读
  • 使用在线工具jsonschema2pojo根据json生成java对象
    本文介绍了使用在线工具jsonschema2pojo根据json生成java对象的方法。通过该工具,用户只需将json字符串复制到输入框中,即可自动将其转换成java对象。该工具还能解析列表式的json数据,并将嵌套在内层的对象也解析出来。本文以请求github的api为例,展示了使用该工具的步骤和效果。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • 本文介绍了RPC框架Thrift的安装环境变量配置与第一个实例,讲解了RPC的概念以及如何解决跨语言、c++客户端、web服务端、远程调用等需求。Thrift开发方便上手快,性能和稳定性也不错,适合初学者学习和使用。 ... [详细]
  • 利用Visual Basic开发SAP接口程序初探的方法与原理
    本文介绍了利用Visual Basic开发SAP接口程序的方法与原理,以及SAP R/3系统的特点和二次开发平台ABAP的使用。通过程序接口自动读取SAP R/3的数据表或视图,在外部进行处理和利用水晶报表等工具生成符合中国人习惯的报表样式。具体介绍了RFC调用的原理和模型,并强调本文主要不讨论SAP R/3函数的开发,而是针对使用SAP的公司的非ABAP开发人员提供了初步的接口程序开发指导。 ... [详细]
  • 闭包一直是Java社区中争论不断的话题,很多语言都支持闭包这个语言特性,闭包定义了一个依赖于外部环境的自由变量的函数,这个函数能够访问外部环境的变量。本文以JavaScript的一个闭包为例,介绍了闭包的定义和特性。 ... [详细]
  • Java学习笔记之面向对象编程(OOP)
    本文介绍了Java学习笔记中的面向对象编程(OOP)内容,包括OOP的三大特性(封装、继承、多态)和五大原则(单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则)。通过学习OOP,可以提高代码复用性、拓展性和安全性。 ... [详细]
  • 本文介绍了Python爬虫技术基础篇面向对象高级编程(中)中的多重继承概念。通过继承,子类可以扩展父类的功能。文章以动物类层次的设计为例,讨论了按照不同分类方式设计类层次的复杂性和多重继承的优势。最后给出了哺乳动物和鸟类的设计示例,以及能跑、能飞、宠物类和非宠物类的增加对类数量的影响。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • 110. Balanced Binary Tree [Easy] 平衡树/递归
    本文介绍了一道关于平衡树的题目,通过递归和辅助函数来判断一个二叉树是否平衡。辅助函数返回根结点的深度,如果左子树或右子树不是平衡树,则返回-1。主函数根据辅助函数的返回值判断二叉树是否平衡。 ... [详细]
  • 欢乐的票圈重构之旅——RecyclerView的头尾布局增加
    项目重构的Git地址:https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集:http:www.jianshu.comno ... [详细]
  • 重入锁(ReentrantLock)学习及实现原理
    本文介绍了重入锁(ReentrantLock)的学习及实现原理。在学习synchronized的基础上,重入锁提供了更多的灵活性和功能。文章详细介绍了重入锁的特性、使用方法和实现原理,并提供了类图和测试代码供读者参考。重入锁支持重入和公平与非公平两种实现方式,通过对比和分析,读者可以更好地理解和应用重入锁。 ... [详细]
author-avatar
uka9032934
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有