热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

oracle分页查询优化_Mongodb分页查询优化上

【背景】最近遇到mongo集群性能问题,主要体现在查询性能或者聚合性能慢(查询类似关系型数据库中select*fromxxwhereaxx,另外聚合类似groupbycount、s

【背景】

       最近遇到mongo集群性能问题,主要体现在查询性能或者聚合性能慢(查询类似关系型数据库中select * from xx where a='xx',另外聚合类似group by+count、sum),nosql与关系型数据库存在很多类似,比如分页查询语句是比较常见问题,分页优化在数据库优化原理类似.常见分页场景需求(本次主要基于这2种场景进行优化介绍)

    1、取top N这种小结果集,想办法利用索引有序特性尽快返回结果集.

db.collection.find({query}).sort({name:1}).limit(50)

    2、分页翻页,尤其是结果集特别多越往后翻页越慢db.collection.find({query}).sort({name:1}).skip(N).limit(50),这里N越大,性能会越低.

【分页top N案例以及优化思路】

       1、具体SQL逻辑:根据网点查询当天的签收明细并返回第一页2000条,所有sql都是查询当天签收,当天从00:00:00-23:59:59,查询时间越接近23:59:59,满足结果集的数据越多,直到数据没有变化.后面还有翻页的功能,暂时先不讨论.其中sort是根据单号来,所有单号都唯一的.signStatus只有0,1.

  db.test.find({org:"10000",signT:{$gte:new Date(1590940800000), $lte: new Date(1591027199999) }, signStatus: { $in: [ 0, 1 ] } }).sort({no:1}).limit(2000);

        2、慢日志中分析不同不同索引对应效率

通过mtools分析慢日志,平均执行时间300ms.

c70e16517495054186ca720dc4fd1ecd.png

        分析一个慢日志情况:

        排序顺序与索引顺序一致则无需排序,执行时间是1084ms:索引【org_1_no_1_signT_1】

        排序顺序与索引顺序不一致则需排序,执行时间是156ms:  索引【org_1_signT_1】

    【org_1_no_1_signT_1】索引执行效率:

    备注:返回6000,因为存在3个分片,需要mongos进一步过滤

     "executionStats": {

         "nReturned": 6000,

         "executionTimeMillis": 1084,

         "totalKeysExamined": 168130,

         "totalDocsExamined": 6000

 【org_1_signT_1】索引执行效率

     "executionStats": {

         "nReturned": 6000,

         "executionTimeMillis": 156,

         "totalKeysExamined": 43744,

         "totalDocsExamined": 43744

       总结:1、排序与回表效率问题;--针对当前小结果集下,ER索引效率要明显高于ESR索引效率.

                 第一个索引满足ESR理论,通过索引没有返回多余的行数,每个节点2000行,但是从16万索引key中过滤满足条件6000,解决排序问题,无排序回表少,索引是检索效率低且执行时间长

                第二个索引不满足ESR理论,只能满足ER理论,索引key与回表结果集一致,回表过滤到37744条.有排序回表多,索引效率高.执行时间短.   

             2、如果结果集呈现N倍数据级增长,比如百万级别,那么ER索引效率肯定低于ESR索引效率,虽然说ESR理论下最佳,但本次SQL写法ESR效率不高.

       3、了解业务需求以及设计原因

    db.test.find({org:"10000",signT:{$gte:new Date(1590940800000), $lte: new Date(1591027199999) }, signStatus: { $in: [ 0, 1 ] } }).sort({no:1}).limit(2000);

          signT时间基本上都是一个时间点,存在少量不一样时间,所以说排序字段不能signT.所以采用no单号,后续沟通集合中存在一个staDate字段,同一天日期完全一致,后续将代码中signT使用staDate来替代,并修改索引为ES索引,完美解决排序与回表问题.

          创建索引:mongodb 4.2版本开始,background:1可以不用加,类似oracle或者mysql online ddl,只是在创建索引与结束加锁.4.2版本之前,后台创建索引比较慢,前台创建是db级别排他锁,导致整个db无法访问.谨慎操作。

          db.test.createIndex({org:1,staDate:1,no:1},{background:1})

      4、最终修业务SQL如下

     db.test.find({org:"10000",staDate: new Date(1591027199999) }, signStatus: { $in: [ 0, 1 ] } }).sort({no:1}).limit(2000);

   【org_1_no:1_staDate_1】索引执行效率

"executionStats" : {

"executionSuccess" : true,

"nReturned" : 6000,

"executionTimeMillis" : 10,

"totalKeysExamined" : 6000,

"totalDocsExamined" : 6000,

【分页top N优化总结】

     1、性能提升 

       通过修改业务SQL逻辑,top 2000执行基本几十毫秒,相比之前最低都要100ms,最大要几秒,性能提升几倍到几十倍,如果数据量提升几个数理级别,提升至少100倍.

     2、不管ESR最佳实践还是ES或者SR等相关索引规则,都是结合实际SQL以及结果集大小来具体问题具体分析,本案例中没有修改业务代码前ER比ESR效果好,即使ER有排序,这些都是建立结果集小的情况下,如果结果集很大,不管ESR还是ER都存在缺点,集合或者索引变成热点问题。




推荐阅读
  • MySQL锁机制详解
    本文深入探讨了MySQL中的锁机制,包括表级锁、行级锁以及元数据锁,通过实例详细解释了各种锁的工作原理及其应用场景。同时,文章还介绍了如何通过锁来优化数据库性能,避免常见的并发问题。 ... [详细]
  • 版本控制工具——Git常用操作(下)
    本文由云+社区发表作者:工程师小熊摘要:上一集我们一起入门学习了git的基本概念和git常用的操作,包括提交和同步代码、使用分支、出现代码冲突的解决办法、紧急保存现场和恢复 ... [详细]
  • 本章详细介绍SP框架中的数据操作方法,包括数据查找、记录查询、新增、删除、更新、计数及字段增减等核心功能。通过具体示例和详细解析,帮助开发者更好地理解和使用这些方法。 ... [详细]
  • 深入解析MySQL中的七种JOIN查询
    本文详细介绍了MySQL中常用的七种JOIN查询方法,包括内连接、左外连接、右外连接、全外连接以及排除连接等,并通过实例进行说明。 ... [详细]
  • window下kafka的安装以及测试
    目录一、安装JDK(需要安装依赖javaJDK)二、安装Kafka三、测试参考在Windows系统上安装消息队列kafka一、安装JDKÿ ... [详细]
  • Oracle 10g 中约束的详细应用与管理
    本文详细介绍了 Oracle 10g 数据库中如何在表和列上使用各种约束,包括 Check 约束、Not Null 约束、Foreign Key 外键约束、Unique 约束等,并提供了具体的 SQL 示例及操作步骤。 ... [详细]
  • 本文详细解析了 SUCTF 2019 中的 EasySQL 题目,重点探讨了堆叠注入与 UNION 注入的区别及其应用条件。 ... [详细]
  • 一、Merge语句根据条件在表中执行修改或插入数据的功能,如果插入的数据行在目的表中存在就执行UPDATE,如果是不存在则执行INSERT:-避免了单独 ... [详细]
  • 58同城的Elasticsearch应用与平台构建实践
    本文由58同城高级架构师于伯伟分享,由陈树昌编辑整理,内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用,特别是在58同城的实施案例,包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]
  • 本文介绍 SQL Server 的基本概念和操作,涵盖系统数据库、常用数据类型、表的创建及增删改查等基础操作。通过实例帮助读者快速上手 SQL Server 数据库管理。 ... [详细]
  • 本文详细介绍了优化DB2数据库性能的多种方法,涵盖统计信息更新、缓冲池调整、日志缓冲区配置、应用程序堆大小设置、排序堆参数调整、代理程序管理、锁机制优化、活动应用程序限制、页清除程序配置、I/O服务器数量设定以及编入组提交数调整等方面。通过这些技术手段,可以显著提升数据库的运行效率和响应速度。 ... [详细]
  • 本文介绍如何使用MFC和ADO技术调用SQL Server中的存储过程,以查询指定小区在特定时间段内的通话统计数据。通过用户界面选择小区ID、开始时间和结束时间,系统将计算并展示小时级的通话量、拥塞率及半速率通话比例。 ... [详细]
  • Oracle中NULL、空字符串和空格的处理与区别
    本文探讨了在Oracle数据库中使用NULL、空字符串('')和空格('_')时可能遇到的问题及解决方案。重点解释了它们之间的区别,以及在查询和函数中的行为。 ... [详细]
  • MongoDB的核心特性与架构解析
    本文深入探讨了MongoDB的核心特性,包括其强大的查询语言、灵活的文档模型以及高效的索引机制。此外,还详细介绍了MongoDB的体系结构,解释了其文档、集合和数据库的层次关系,并对比了MongoDB与传统关系型数据库(如MySQL)的逻辑结构。 ... [详细]
  • Spring Cloud因其强大的功能和灵活性,被誉为开发分布式系统的‘一站式’解决方案。它不仅简化了分布式系统中的常见模式实现,还被广泛应用于企业级生产环境中。本书内容详实,覆盖了从微服务基础到Spring Cloud的高级应用,适合各层次的开发者。 ... [详细]
author-avatar
LeoWang
帅气鄙人的PHP程序员
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有