热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

NoSQL数据库学习之MongoDB之groupby限制

NoSQL数据库学习之MongoDB之groupby限制如果你用group命令的话可能会遇到下面两种错误:www.2cto.coma.)命令:db.flogsamplelog.group({cond:{datetimes:20111027},key:{pid:1},initial:{count:0},reduce:function(doc,prev){if(doc.pidprev.pid)prev

NoSQL数据库学习之MongoDB之group by限制 如果你用group 命令的话可能会遇到下面两种错误: www.2cto.com a.)命令:db.flogsamplelog.group({cond:{datetimes:20111027},key:{pid:1},initial:{count:0},reduce:function(doc,prev){if(doc.pid==prev.pid)prev


NoSQL数据库学习之MongoDB之group by限制

如果你用group 命令的话可能会遇到下面两种错误:

www.2cto.com

a.)命令:db.flogsamplelog.group({cond:{datetimes":20111027},key:{"pid":"1"},initial:{"count":0},reduce:function(doc,prev){if(doc.pid==prev.pid)prev.count++;}})

error:

Mon Oct 31 12:00:00uncaught exception: group command failed: {

"errmsg" : "exception: group() can't handle more than 10000 unique keys",

"code" : 10043,

"ok" : 0

} 直接访问shard server端口

b.)命令:db.flogsamplelog.group({cond:{"pid":322963713,"datetimes":20111027},key:{"worktype":"1"},initial:{"count":0},reduce:function(doc,prev){if(doc.worktype==prev.worktype)prev.count++;}})

error:

Mon Oct 31 12:00:09 uncaught exception: group command failed: { "ok" : 0, "errmsg" : "can't do command: group on sharded collection" } 直接访问route server端口

其次我们在mongodb权威指南上也能发现这样的语句:

The price of using MapReduce is speed: group is not particularly speedy, but

MapReduce is slower and is not supposed to be used in “real time.” You run

MapReduce as a background job, it creates a collection of results, and then

you can query that collection in real time.

经过测试发现group by效率在建立索引之后也没有实质性提高。

具体命令中涉及到的字段以及表定义,这里就不在敷衍。


推荐阅读
  • 本文深入探讨了分布式文件系统的核心概念及其在现代数据存储解决方案中的应用,特别是针对大规模数据处理的需求。文章不仅介绍了多种流行的分布式文件系统和NoSQL数据库,还提供了选择合适系统的指导原则。 ... [详细]
  • HBase运维工具全解析
    本文深入探讨了HBase常用的运维工具,详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说,这些工具是日常管理和故障排查的重要手段。 ... [详细]
  • 构建高性能Feed流系统的设计指南
    随着移动互联网的发展,Feed流系统成为了众多社交应用的核心组成部分。本文将深入探讨如何设计一个高效、稳定的Feed流系统,涵盖从基础架构到高级特性的各个方面。 ... [详细]
  • 本文档旨在为初学者提供MongoDB的基础知识介绍,包括其作为文档型数据库的特点、基本概念以及如何通过命令行界面(CLI)执行基本的操作。 ... [详细]
  • Redis:缓存与内存数据库详解
    本文介绍了数据库的基本分类,重点探讨了关系型与非关系型数据库的区别,并详细解析了Redis作为非关系型数据库的特点、工作模式、优点及持久化机制。 ... [详细]
  • 本文探讨了Hive作业中Map任务数量的确定方式,主要涉及HiveInputFormat和CombineHiveInputFormat两种InputFormat的分片计算逻辑。通过调整相关参数,可以有效控制Map任务的数量,进而优化Hive作业的性能。 ... [详细]
  • MapReduce原理是怎么剖析的
    这期内容当中小编将会给大家带来有关MapReduce原理是怎么剖析的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1 ... [详细]
  • 深入解析Spark核心架构与部署策略
    本文详细探讨了Spark的核心架构,包括其运行机制、任务调度和内存管理等方面,以及四种主要的部署模式:Standalone、Apache Mesos、Hadoop YARN和Kubernetes。通过本文,读者可以深入了解Spark的工作原理及其在不同环境下的部署方式。 ... [详细]
  • 大数据时代的机器学习:人工特征工程与线性模型的局限
    本文探讨了在大数据背景下,人工特征工程与线性模型的应用及其局限性。随着数据量的激增和技术的进步,传统的特征工程方法面临挑战,文章提出了未来发展的可能方向。 ... [详细]
  • 本文介绍了Hive作为基于Hadoop的数据仓库工具的核心概念,包括其基本功能、使用理由、特点以及与Hadoop的关系。同时,文章还探讨了Hive相较于传统关系型数据库的不同之处,并展望了Hive的发展前景。 ... [详细]
  • 全面解读Apache Flink的核心架构与优势
    Apache Flink作为大数据处理领域的新兴力量,凭借其独特的流处理能力和高效的批处理性能,迅速获得了广泛的关注。本文旨在深入探讨Flink的关键技术特点及其应用场景,为大数据处理提供新的视角。 ... [详细]
  • 开发笔记:Mongodb副本集集群搭建 ... [详细]
  • 深入浅出:Hadoop架构详解
    Hadoop作为大数据处理的核心技术,包含了一系列组件如HDFS(分布式文件系统)、YARN(资源管理框架)和MapReduce(并行计算模型)。本文将通过实例解析Hadoop的工作原理及其优势。 ... [详细]
  • 开发笔记:每篇半小时1天入门MongoDB——3.MongoDB可视化及shell详解
    开发笔记:每篇半小时1天入门MongoDB——3.MongoDB可视化及shell详解 ... [详细]
  • 初探Hadoop:第一章概览
    本文深入探讨了《Hadoop》第一章的内容,重点介绍了Hadoop的基本概念及其如何解决大数据处理中的关键挑战。 ... [详细]
author-avatar
ckx1989
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有