热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

MongoDB2.6发布—KellyStirman访谈

摘要:对于NoSQL用户而言,MongoDB无需介绍了。MongoDB产品营销总监KellyStirman就最新的2.6稳定版回答了有关问题。最后,除其它更新外,我们还获得了关于集合级锁的进一步信息,它是MongoDBjira跟踪系统中受关注程度最...对于NoSQL用户而言,MongoDB无

摘要 : 对于NoSQL用户而言,MongoDB无需介绍了。MongoDB产品营销总监Kelly Stirman就最新的2.6稳定版回答了有关问题。最后,除其它更新外,我们还获得了关于集合级锁的进一步信息,它是MongoDB jira跟踪系统中受关注程度最 ... 对于NoSQL用户而言,MongoDB无

摘要: 对于NoSQL用户而言,MongoDB无需介绍了。MongoDB产品营销总监Kelly Stirman就最新的2.6稳定版回答了有关问题。最后,除其它更新外,我们还获得了关于集合级锁的进一步信息,它是MongoDB jira跟踪系统中受关注程度最 ...

  对于NoSQL用户而言,MongoDB无需介绍了。MongoDB产品营销总监Kelly Stirman就最新的2.6稳定版回答了有关问题。最后,除其它更新外,我们还获得了关于集合级锁的进一步信息,它是MongoDB jira跟踪系统中受关注程度最高、得票最多的特性请求。


  在MongoDB中,当更新迫使引擎在BSON存储中移动文档时,存储碎片可以导致意外的延迟。您能给我们解释一下,2.6版本是如何帮助缓解这一问题的吗?

如果有足够的空间,在MongoDB中更新文档时,数据会在原地更新。如果更新后的文档大小大于已经分配的空间,那么文档会在一个新位置被重写。MongoDB最终会重用原来的空间,但这可能需要时间,而且空间可能会过度分配。

在MongoDB 2.6中,默认的空间分配策略将是powerOf2Sizes,这个选项从MongoDB 2.2开始就已经提供了。该设置会将MongoDB分配的空间大小向上取整为2的幂(比如,2、4、6、8、16、32、64等等)。该设置会降低需要移动文档的几率,并使空间可以更高效地重用,结果是更少的空间过度分配和更可预测的性能。用户仍然可以使用精确匹配的分配策略,如果文档大小不增加,该策略更节省空间。


  对于基于SQL和NoSQL的数据库,索引数据都能够提供很大的帮助,但有时候在扩展写性能时又可能是件麻烦事。您能给我们解释一下,2.6版本的“索引交叉(index interp)”如何减少需要的索引数目吗?

作为例子,考虑一个销售报告应用程序:产品经理想要找出所有定购特定部件号超过给定数量的客户。使用索引交叉,可以组合(交叉)部件号和数量的现有索引来优化查询,而不需要单独的复合索引。这还会使工作集大小开销减少,更新更高效。

目前,索引交叉支持两个索引的交叉,而且在候选结果集大致相等时使用最好,对于那些能够从“覆盖索引(covered indexes)”处理的查询尤其如此。在预先知道多字段谓词的情况下,使用复合索引处理查询更快。

对于某些在单个索引上的操作,索引交叉也能提高它们的性能,可以将此称为“自交叉(self-interps)”。在使用诸如in或all这样的操作符时,MongoDB 2.6可能会多次扫描索引,然后取结果的交集。这能显著减少处理查询时必须返回的完整文档的数目。


  “孤立文档(Orphaned documents)”会使某些查询产生不正确的结果。您能详细说明一下2.6版本是如何帮助我们解决这个问题的吗?

在正常情况下,系统中不会有孤立文档。不过,块迁移过程中的一些失败情况可能会留下孤立文档。孤立文档的存在会使某些查询产生不正确的结果。而孤立文档可以安全删除,在2.6之前的版本中,没有简单的方法来这样做。在MongoDB 2.6中,我们实现了一个新的用于数据库分片集群的管理命令:cleanupOrphaned()。该命令会在数据的单个范围内从分片中删除孤立文档。关于这个话题,我们的一位支持工程师写了一篇不错的博文。


  在企业中,MongoDB用得越来越多。在企业采用方面,MongoDB在NoSQL生态系统中是如何定位的,以及2.6版本改进了哪些关键特性?

MongoDB在许多组织中广泛使用,包括30个财富100强的组织。我们看到,组织希望标准化几个数据库系统,而许多组织选择MongoDB是因为它可以用于各种各样的应用程序,这归功于它灵活的数据模型、丰富的索引、扩展性以及它大大提升了开发团队的生产力。

MongoDB 2.6提供了许多安全增强,这对于企业而言非常关键。这些特性包括LDAP、x.509和Kerberos身份验证、SSL加密、用户定义角色、审计和字段级安全。IBM Guardium也提供了与MongoDB的集成,这提供了更广泛的审计能力。

跟企业相关的另一个重要的趋势是我们的生态系统规模,它现在已经包含了超过400个合作伙伴。在这些合作伙伴中,有许多都提供了与MongoDB的集成,包括Informatica、Microstrategy、QlikTech、Pentaho、Talend等,其他还有许多。


  全文搜索一直是一个有大量请求的特性,尽管2.4版本已经有了一个试验性的实现,而且恰恰是由Eliot自己提交的,但在2.6版本中才增加了$text操作符。2.6版本的全文搜索有多成熟,以及它是如何面对NoSQL数据库领域的竞争的?

在过去一年里,我们与社区紧密合作,测试文本搜索,并将其能力集成到其它特性中。告别测试版,MongoDB 2.6的文本搜索现在可用于生产环境,而且还提供了新特性,包括:

与MongoDB的查询引擎集成,所以文本搜索可以与一般查询操作符结合使用,通过限制、跳过、排序和过滤结果的能力提供更丰富的查询。例如,用户可以在一个博文集合中搜索特定的短语,但使用一个额外的条件将搜索限制在过去七天的博文中;支持多语言文档;文本搜索语句可以用在“聚合框架(Aggregation Framework)”中,通过对匹配的文本进行计数和分组提供更深入地分析。

其他NoSQL供应商提供与单独的专用搜索引擎的集成,如SOLR和Elastic Search。这种方式增加了部署的复杂性和成本,需要额外的技能,而且这些索引与底层的数据不一致。我们认为,原生的文本搜索更容易部署,成本更低,而且可以充分利用现有技能,同时保持与底层数据的一致性。不过,专用搜索引擎提供的某些特性,MongoDB并没有提供,但我们也像其他NoSQL供应商一样,提供了类似的与这些产品集成的选项。使用MongoDB,用户可以从这两种方式中选择一种使用。


  更细粒度的锁可能是请求最多的特性。与数据库级相比,你们更进一步的路线图是什么?与集合级锁相比,更进一步的主要障碍是什么?

重要的是要记住,MongoDB中的锁与RDBMS中的“闩(latch)”非常接近——它们非常简单,通常持有10微秒或者更少。MongoDB 2.2引入了更高级的锁让步算法,显著减少了我们在社区中看到的与锁争用相关的问题的数量。不过,我们认识到,还有机会改进并发性,其中包括更细粒度的锁。

MongoDB 2.8将具备文档级锁。我们认为,与集合级锁相比,这会更显著地改进更广泛应用程序的并发性。但是,更细粒度的锁只是改进并发性的一部分,我们将改进数据库的其它方面,以便在整体上提供更大的并发。MongoDB 2.6已经包含了部分改进(参见下文),MongoDB 2.8将带来更多。


  MongoDB 2.6有助于解决其它锁问题吗?

是的,许多增强都有助于改进并发性。例如,索引交叉减少了许多应用程序所需索引的数量,提高了写可扩展性。许多我们过去在锁内做的工作如今在锁外执行,如解析和_id生成。我们已经做了大量工作来改进操作日志写并发,既包括使每次写更快,也包括更改锁的工作机制。这项工作改进了2.6版本的并发性,在更细粒度的锁可用之前,这是必须的,否则这些东西将很快成为下一个瓶颈。


推荐阅读
  • 构建高性能Feed流系统的设计指南
    随着移动互联网的发展,Feed流系统成为了众多社交应用的核心组成部分。本文将深入探讨如何设计一个高效、稳定的Feed流系统,涵盖从基础架构到高级特性的各个方面。 ... [详细]
  • 58同城的Elasticsearch应用与平台构建实践
    本文由58同城高级架构师于伯伟分享,由陈树昌编辑整理,内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用,特别是在58同城的实施案例,包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]
  • Redis:缓存与内存数据库详解
    本文介绍了数据库的基本分类,重点探讨了关系型与非关系型数据库的区别,并详细解析了Redis作为非关系型数据库的特点、工作模式、优点及持久化机制。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 迎接云数据库新时代:程序员如何应对变革?
    在数据无处不在的时代,数据库成为了管理和处理数据的核心工具。从早期的信息记录方式到现代的云数据库,数据库技术经历了巨大的变革。本文将探讨云数据库的特点及其对程序员的影响。 ... [详细]
  • 本文旨在探讨机器学习与数据分析之间的差异,不仅在于它们处理的数据类型,还包括技术背景、业务应用场景以及参与者的不同。通过深入分析,希望能为读者提供清晰的理解。 ... [详细]
  • 本文深入探讨了分布式文件系统的核心概念及其在现代数据存储解决方案中的应用,特别是针对大规模数据处理的需求。文章不仅介绍了多种流行的分布式文件系统和NoSQL数据库,还提供了选择合适系统的指导原则。 ... [详细]
  • MySQL 8.0 新特性详解:免费视频教程上线
    本文介绍了一套在慕课网上发布的免费视频教程,深入解析 MySQL 8.0 的核心新功能,包括增强的安全性、用户管理、新的索引类型、CTE 和窗口函数等。 ... [详细]
  • 本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射,详细解释了两者的创建、加载及删除操作,并提供了查看表详细信息的方法。通过对比这两种表类型,帮助读者理解如何更好地管理和保护数据。 ... [详细]
  • 使用C#开发SQL Server存储过程的指南
    本文介绍如何利用C#在SQL Server中创建存储过程,涵盖背景、步骤和应用场景,旨在帮助开发者更好地理解和应用这一技术。 ... [详细]
  • MySQL 数据库迁移指南:从本地到远程及磁盘间迁移
    本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移,包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机,以及解决迁移过程中可能遇到的问题。 ... [详细]
  • Spring Cloud因其强大的功能和灵活性,被誉为开发分布式系统的‘一站式’解决方案。它不仅简化了分布式系统中的常见模式实现,还被广泛应用于企业级生产环境中。本书内容详实,覆盖了从微服务基础到Spring Cloud的高级应用,适合各层次的开发者。 ... [详细]
  • 利用 Jest 和 Supertest 实现接口测试的全面指南
    本文深入探讨了如何使用 Jest 和 Supertest 进行接口测试,通过实际案例详细解析了测试环境的搭建、测试用例的编写以及异步测试的处理方法。 ... [详细]
  • ODBC介绍:开放式数据库连接详解
    本文详细介绍了ODBC(开放式数据库连接),这是一种允许应用程序访问多种数据库系统的标准API。自1992年由微软与Simba合作推出以来,ODBC已成为跨平台数据访问的重要标准。 ... [详细]
  • ArchSummit深圳2014将于7月18日拉开帷幕,所有讲师已确认,涵盖9个热门话题,共36场精彩报告。InfoQ中文站提供了详细的讲师和报告列表。 ... [详细]
author-avatar
王漻_957
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有