热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

celery可视化_Celery最佳实践

1.用好celerybeat如果你想更好的管理项目的定时任务,可以用celerybeat代替crontab管理。celery不仅支持动态的异步任务(通过delay调用

1.用好celery beat

如果你想更好的管理项目的定时任务,可以用celery beat代替crontab管理。celery不仅支持动态的异步任务(通过delay调用),也支持定时任务执行。当然我们可以用crontab实现任务的定时执行,但是crontab是与项目代码隔离的,为了更方便地管理定时任务用celery beat代替也是一个不错的选择。celery beat是celery额外起的一个进程,具体命令行:

celery -A yourApp beat

该进程开启后会根据配置定期的发送任务到broker中,最终任务的执行还是由worker执行:

celery -A yourApp worker

2.参数传递

大多数场景下传递任意数据时可行的,但是如果数据内容本身是可变的,那么这时候就要仔细考虑了。假定参数是一个对象,这个对象映射到数据库中的一行数据,如果任务在等待执行的过程中该行数据有改变,那么在任务执行的时候,使用到的这个对象就是一个过期数据。所以尽量传递不变(这里的不变与python不可变数据类型不是一个概念)的参数。

3.序列化方式

celery支持多种序列化方式,但是每种序列化方式产生的数据大小是不同的,如果在broker吞吐量存在瓶颈的情况下,可以选择产生数据较小的序列化方式

4.使用计划任务

假定有这样一个场景,用户创建了订单,减少了商品库存,但是还未支付,这时候需要给用户一个限定的支付时间如半个小时,如果半个小时之后这笔订单还未支付,那么就撤销该订单,重置商品库存。这个时候可以用到celery的计划任务,也就是任务发出后并不会马上执行,会在指定的时间点执行。我们可以用countdown或者eta参数实现该功能:

eta给到的时间有时区的问题,所以我在上述代码中减去了八个小时。

5.任务优先级

如果执行的任务相同,但是这些相同的任务会有不同的优先级,如果想使某个任务具有更高的优先级,那么可以使用priority参数来完成。

这里会存在一个问题。redis broker的priority只支持0、3、6、9四个级别,底层的实现方式是用不同的队列来实现的。大致的做法是为每个优先的任务生成一个队列,更高优先级的任务投递到更高优先级的队列,worker工作的时候更倾向于从高优先级队列获取任务。

6.broker的选择

不要使用mysql作为broker。虽然celery支持mysql作为broker,但我们还是不要用mysql,因为如果任务量一旦上来,mysql会存在大量的磁盘io,不利于任务系统良好的运行。rabbitmq是官方推荐的broker,也是完全实现了amqp协议的broker。相比较而言,redis更轻量级,但也是一个较好的选择。

7.worker命名

给celery worker指定一个唯一的名字,可以让我们更好的区分不同的worker。可以用-n参数指定name

8.为不同的队列开启不同的worker

我们尽量给不同的任务指定不同的队列,有的任务具有更高的优先级,有的反而没那么重要,所以分开来是有必要的。在开启的worker的时候指定队列,执行一组相同的任务。

9.选择合适的并发方式

celery提供了几种并发方式,包括prefork、gevent、eventlet等,如果执行的任务是cpu密集型的可以选择prefork的方式(也是默认的方式),如果是网络io密集型的可以选择gevent或者eventlet,这两者都用到了io多路复用的技术。选择恰当的并发方式可能可以极大的提升处理能力。并发数的选择也需要考虑一下,并不是越多越好,多了需要处理大量的上下文切换,少了不能明显提高性能,这里可能需要一个测试。

10.执行的幂等性

对于broker而言,任务重复下发是存在的,虽然这种可能性微乎其微。所以对于同一个任务,即使多次执行,不会也不应该产生数据异常。这需要在代码层面实现。

11.小心使用retry

retry的机制未深入研究,但是在我工作初期,因为不当地使用retry,导致任务指数级的增长,最终整个broker塞满了消息。大致是因为任务失败后同时retry了两次,并且下一次执行还是失败,继续两次retry(此时总的是4次retry),如此指数增长。

12.给任务设置timeout

如果不给单个任务设置超时时间,一旦某个任务卡死(比如产生死锁),整个worker将一直不可用,除非重启。可以使用--time-limit参数指定超时时间。

13.接入sentry

接入sentry可以让我们快速定位错误,解决问题。

14.backend设置

celery的backend是指任务执行结果的存储服务,一般用redis作为backend即可。执行task.apply_async()方法后生成一个result对象,调用result.get()可以从backend中读取结果。当然如果对执行的结果不关心可以配置celery为ignore result,此时不会存储结果。如果需要存储结果,也需要给结果设置一定的超时时间。

15.flower监控

flower是celery的一个可视化监控工具。我们可以从上面看到如worker工作情况、队列长度等信息,也可以执行远程控制等操作。出现问题时,celery监控系统可能会帮助使用者更快的定位问题。



推荐阅读
  • 上图是InnoDB存储引擎的结构。1、缓冲池InnoDB存储引擎是基于磁盘存储的,并将其中的记录按照页的方式进行管理。因此可以看作是基于磁盘的数据库系统。在数据库系统中,由于CPU速度 ... [详细]
  • MySQL数据库锁机制及其应用(数据库锁的概念)
    本文介绍了MySQL数据库锁机制及其应用。数据库锁是计算机协调多个进程或线程并发访问某一资源的机制,在数据库中,数据是一种供许多用户共享的资源,如何保证数据并发访问的一致性和有效性是数据库必须解决的问题。MySQL的锁机制相对简单,不同的存储引擎支持不同的锁机制,主要包括表级锁、行级锁和页面锁。本文详细介绍了MySQL表级锁的锁模式和特点,以及行级锁和页面锁的特点和应用场景。同时还讨论了锁冲突对数据库并发访问性能的影响。 ... [详细]
  • 安装mysqlclient失败解决办法
    本文介绍了在MAC系统中,使用django使用mysql数据库报错的解决办法。通过源码安装mysqlclient或将mysql_config添加到系统环境变量中,可以解决安装mysqlclient失败的问题。同时,还介绍了查看mysql安装路径和使配置文件生效的方法。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 关于我们EMQ是一家全球领先的开源物联网基础设施软件供应商,服务新产业周期的IoT&5G、边缘计算与云计算市场,交付全球领先的开源物联网消息服务器和流处理数据 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • Tomcat/Jetty为何选择扩展线程池而不是使用JDK原生线程池?
    本文探讨了Tomcat和Jetty选择扩展线程池而不是使用JDK原生线程池的原因。通过比较IO密集型任务和CPU密集型任务的特点,解释了为何Tomcat和Jetty需要扩展线程池来提高并发度和任务处理速度。同时,介绍了JDK原生线程池的工作流程。 ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • Python SQLAlchemy库的使用方法详解
    本文详细介绍了Python中使用SQLAlchemy库的方法。首先对SQLAlchemy进行了简介,包括其定义、适用的数据库类型等。然后讨论了SQLAlchemy提供的两种主要使用模式,即SQL表达式语言和ORM。针对不同的需求,给出了选择哪种模式的建议。最后,介绍了连接数据库的方法,包括创建SQLAlchemy引擎和执行SQL语句的接口。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识,希望对你有一定的参考价值。 ... [详细]
  • linux进阶50——无锁CAS
    1.概念比较并交换(compareandswap,CAS),是原⼦操作的⼀种,可⽤于在多线程编程中实现不被打断的数据交换操作࿰ ... [详细]
author-avatar
手机用户2502922685
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有