当前位置: 开发笔记 > 编程语言 > 正文

Celery分布式任务队列入门

作者：濛宝贝儿 | 来源：互联网 | 2023-09-02 16:51

Celery 是一个基于python开发的分布式异步消息任务队列，通过它可以轻松的实现任务的异步处理，如果你的业务场景中需要用到异步任务，就可以考虑使用celery，举几个实例场景中可用的例子:

你想对100台机器执行一条批量命令，可能会花很长时间，但你不想让你的程序等着结果返回，而是给你返回一个任务ID,你过一段时间只需要拿着这个任务id就可以拿到任务执行结果，在任务执行ing进行时，你可以继续做其它的事情。
你想做一个定时任务，比如每天检测一下你们所有客户的资料，如果发现今天是客户的生日，就给他发个短信祝福

Celery 在执行任务时需要通过一个消息中间件来接收和发送任务消息，以及存储任务结果，一般使用rabbitMQ or Redis,后面会讲

1.1 Celery有以下优点：

简单：一单熟悉了celery的工作流程后，配置和使用还是比较简单的
高可用：当任务执行失败或执行过程中发生连接中断，celery 会自动尝试重新执行任务
快速：一个单进程的celery每分钟可处理上百万个任务
灵活：几乎celery的各个组件都可以被扩展及自定制

Celery基本工作流程图

Celery 分布式任务队列入门

1.2 Celery安装使用

Celery的默认broker是RabbitMQ, 我这里使用redis,仅需配置一行就可以

broker_url = 'amqp://guest:guest@localhost:5672//'

使用Redis做broker也可以

broker_url = 'redis://:password@localhost:6379'

　注意：celery任务队列执行使用的中间件和取结果的中间件是彼此分离的，在使用中都需要各自配置

Celery 分布式任务队列入门

1. 3 开始使用Celery啦　　

安装celery模块

pip3 install celery

创建一个celery application 用来定义你的任务列表

创建一个任务文件就叫tasks.py吧

from celery import Celery
 
#app是一个worker,负责执行任务，多个worker执行时，任务执行顺序为抢占式，并不会按照类似于rabbitmq分配任务
app = Celery('tasks',   
             broker='redis://:password@localhost',   #执行任务中间件  
             backend='redis://:password@localhost')    #保存结果中间件
 
@app.task
def add(x,y):   #这是worker可以执行的一个任务
    print("running...",x,y)
    return x+y

　启动Celery Worker来开始监听并执行任务　

celery -A celery_test worker -l debug

　打印结果如下：

Celery 分布式任务队列入门

上面显示配置信息

下面红线内为自定义任务：

Celery 分布式任务队列入门

调用任务

再打开一个终端，进行命令行模式，调用任务

>>> from celery_test import add
>>> add.delay(4, 4)

看你的worker终端会显示收到一个任务，此时你想看任务结果的话，需要在调用任务时　赋值个变量

>>> result = add.delay(4, 4)

如果想查看任务是否完成，可调用下面命令，返回布尔值

>>> result.ready()

　想拿到任务执行结果，调用下面命令（注意：想拿到结果首先得配置接收任务的中间件，否则会报错）

result.get()

二、在项目中如何使用celery　

可以把celery配置成一个应用　

目录格式如下

proj/__init__.py
    /celery.py   #配置信息
    /tasks.py    #任务

　配置结果如下：　

　 Celery 分布式任务队列入门

编辑proj/celery.py文件:

from __future__ import absolute_import, unicode_literals  #声明celery从python包绝对路径里导入celery包
from celery import Celery
 
app = Celery('proj',
             broker='amqp://',
             backend='amqp://',
             include=['proj.tasks'])  #任务文件路径列表,可添加多个任务
 
# Optional configuration, see the application user guide.
app.conf.update(
    result_expires=3600,   #任务结果保存时间
)
 
if __name__ == '__main__':
    app.start()

`编辑proj/tasks.py中的内容`

from __future__ import absolute_import, unicode_literals
from .celery import app  #导入同级目录下celery文件中的app


@app.task
def add(x, y):
    return x + y


@app.task
def mul(x, y):
    return x * y


@app.task
def xsum(numbers):
    return sum(numbers)

　cd到proj文件夹上一级启动worker ，命令如下

 celery -A proj worker -l debug

　执行结果：

Celery 分布式任务队列入门

同时启动多个worker:

Celery 分布式任务队列入门

停止某个worker:(stopwait是等待当前任务完成停止，stop是立即停止)

Celery 分布式任务队列入门

三：celery+django项目

django 可以轻松跟celery结合实现异步任务，只需简单配置即可

Celery 分布式任务队列入门

第一步：在settings.py同级目录下，创建celery.py文件

from __future__ import absolute_import, unicode_literals
import os
from celery import Celery
 
# set the default Django settings module for the 'celery' program.
os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'PERCRM.settings')    #根据具体项目配置
 
app = Celery('PERCRM')
 
# Using a string here means the worker don't have to serialize
# the configuration object to child processes.
# - namespace='CELERY' means all celery-related configuration keys
#   should have a `CELERY_` prefix.
app.config_from_object('django.conf:settings', namespace='CELERY')
 
# Load task modules from all registered Django app configs.
app.autodiscover_tasks()   #自动发现各个app里面创建的celery任务，可以创建多个任务

@app.task(bind=True) def debug_task(self): print('Request: {0!r}'.format(self.request))

第二步：配置settings.py同级目录下的init.py文件

from __future__ import absolute_import, unicode_literals

# This will make sure the app is always imported when
# Django starts so that shared_task will use this app.
from .celery import app as celery_app

__all__ = ['celery_app']

第三步：配置settings.py文件　　

CELERY_BROKER_URL = 'redis://:123456@192.168.2.107'
CELERY_RESULT_BACKEND = 'redis://:123456@192.168.2.107'

第四步：创建任务文件，在APP下创建tasks.py文件

Celery 分布式任务队列入门

任务内容格式如下：

# Create your tasks here
from __future__ import absolute_import, unicode_literals
from celery import shared_task  #可以跟其他APP共享任务


@shared_task
def add(x, y):
    return x + y


@shared_task
def mul(x, y):
    return x * y


@shared_task
def xsum(numbers):
    return sum(numbers)

　此时，基本的配置就完了，加上一条对应的视图，整个项目就可以结合celery运行了　

urls.py:

Celery 分布式任务队列入门

views.py

from students.tasks import add,mul


def celery_test(request):
    task = add.delay(123,456)

    return HttpResponse(task.id)

　现在我们启动项目：

Celery 分布式任务队列入门

进到项目里面启动celery

Celery 分布式任务队列入门

此时在浏览器访问http://192.168.2.107:8866/celery_test/

结果如下，返回了celery任务id，一个简单的celery与django结合的项目就完成了

Celery 分布式任务队列入门

再查看服务端celery

Celery 分布式任务队列入门

四、Celery 定时任务

celery支持定时任务，设定好任务的执行时间，celery就会定时自动帮你执行，这个定时任务模块叫celery beat

写一个脚本叫periodic_task.py

from celery import Celery
from celery.schedules import crontab
 
app = Celery()
 
@app.on_after_configure.connect  #装饰器作用：只要脚本一启动便立刻自动执行被装饰的函数
def setup_periodic_tasks(sender, **kwargs):
    # Calls test('hello') every 10 seconds.
    sender.add_periodic_task(10.0, test.s('hello'), name='add every 10')  #每隔十秒钟，执行test函数，传入参数‘hello’,
 
    # Calls test('world') every 30 seconds
    sender.add_periodic_task(30.0, test.s('world'), expires=10)  #expires任务结果保存十秒钟
  
    # Executes every Monday morning at 7:30 a.m.
    sender.add_periodic_task(
        crontab(hour=7, minute=30, day_of_week=1),
        test.s('Happy Mondays!'),  #每周一早上十点半执行test函数
    )
 
@app.task
def test(arg):
    print(arg)

　add_periodic_task 会添加一条定时任务

上面是通过调用函数添加定时任务，也可以像写配置文件一样的形式添加，下面是每30s执行的任务　

app.conf.beat_schedule = {
    'add-every-30-seconds': {
        'task': 'tasks.add',
        'schedule': 30.0,
        'args': (16, 16)
    },
}
app.conf.timezOne= 'UTC'

　任务添加好了，需要让celery单独启动一个进程来定时发起这些任务，注意，这里是发起任务，不是执行，这个进程只会不断的去检查你的任务计划，每发现有任务需要执行了，就发起一个任务调用消息，交给celery worker去执行　

启动任务调度器 celery beat，（注意：需写上具体的任务名）

Celery 分布式任务队列入门

输出：

Celery 分布式任务队列入门

worker打印输出：

Celery 分布式任务队列入门

五、在django中使用计划任务功能

第一步：安装模块

pip3 install django-celery-beat

第二步：在django项目的settings.py中INSTALLED_APPS的配置

Celery 分布式任务队列入门

第三步：配置完之后，需要同步数据库，执行migrate与makemigrations命令

以上操作完成之后，启动django项目，访问http://192.168.2.107:8866/admin/

在admin页面我们会看到底部多了一个三张表出来

Celery 分布式任务队列入门

配置完长这样

Celery 分布式任务队列入门

此时启动你的celery beat 和worker，会发现每隔2分钟，beat会发起一个任务消息让worker执行scp_task任务

注意，经测试，每添加或修改一个任务，celery beat都需要重启一次，要不然新的配置不会被celery beat进程读到

推荐阅读

main
Python正则表达式详解：掌握数量词用法轻松上手

Python正则表达式详解：掌握数量词用法轻松上手 ... [详细]

蜡笔小新 2024-10-28 09:12:57
cpython
Python Cvxopt安装指南与线性规划问题求解方法

在Python 2.7环境中使用PyCharm进行Cvxopt的安装及线性规划问题求解。具体步骤包括：通过PyCharm的文件菜单进入项目设置，选择解释器选项，点击右侧的“+”按钮，在可用包列表中搜索并安装Cvxopt。安装完成后，可以通过导入Cvxopt库并调用其函数来解决线性规划问题，提高模型的准确性和效率。 ... [详细]

蜡笔小新 2024-10-29 19:03:32
text
voc生成xml 代码

目录 lxmlwindows安装读取示例可视化生成示例上面是代码，下面有调用示例 api调用代码，其实只有几行：这个生成代码也很简 ... [详细]

蜡笔小新 2024-10-30 09:23:45
text
开发心得：利用 Redis 构建分布式系统的轻量级协调机制

开发心得：利用 Redis 构建分布式系统的轻量级协调机制 ... [详细]

蜡笔小新 2024-10-29 07:37:33
format
第七天深入学习DGL框架：官方文档指导下的数据集下载与预处理技巧

在第七天的深度学习课程中，我们将重点探讨DGL框架的高级应用，特别是在官方文档指导下进行数据集的下载与预处理。通过详细的步骤说明和实用技巧，帮助读者高效地构建和优化图神经网络的数据管道。此外，我们还将介绍如何利用DGL提供的模块化工具，实现数据的快速加载和预处理，以提升模型训练的效率和准确性。 ... [详细]

蜡笔小新 2024-10-27 21:10:17
format
运用Isotonic回归算法解决鸢尾花数据集中的回归挑战

本文探讨了利用Isotonic回归算法解决鸢尾花数据集中的回归问题。首先介绍了Isotonic回归的基本原理及其在保持单调性方面的优势，并通过具体示例说明其应用方法。随后详细描述了鸢尾花数据集的特征和获取途径，最后展示了如何将Isotonic回归应用于该数据集，以实现更准确的预测结果。 ... [详细]

蜡笔小新 2024-10-26 18:39:17
format
Windows 10 下 Python 3 与 OpenCV 3 的环境配置指南及推荐书籍

在 Windows 10 系统下配置 Python 3 和 OpenCV 3 的环境时，建议使用 Anaconda 分发版以简化安装过程。Anaconda 可以从其官方网站（https://www.anaconda.com/download）下载。此外，本文还推荐了几本关于 Python 和 OpenCV 的专业书籍，帮助读者深入理解和应用相关技术。 ... [详细]

蜡笔小新 2024-11-01 17:28:30
format
如何利用Python脚本实现钉钉自动化考勤打卡

本文详细探讨了利用Python脚本实现钉钉自动化考勤打卡的方法。通过具体实例操作，解决了很多用户在实际应用中遇到的难题，帮助读者高效掌握这一实用技能。 ... [详细]

蜡笔小新 2024-10-31 15:57:11
format
Python学习：环境配置与安装指南

Python作为一种跨平台的编程语言，适用于Windows、Linux和macOS等多种操作系统。为了确保本地已成功安装Python，用户可以通过终端或命令行界面输入`python`或`python3`命令进行验证。此外，建议使用虚拟环境管理工具如`venv`或`conda`，以便更好地隔离不同项目依赖，提高开发效率。 ... [详细]

蜡笔小新 2024-10-31 12:18:21
require
在Linux系统中构建51单片机开发与编程环境——基于Makefile的详细指南

本文详细介绍了如何在Linux系统中搭建51单片机的开发与编程环境，重点讲解了使用Makefile进行项目管理的方法。首先，文章指导读者安装SDCC（Small Device C Compiler），这是一个专为小型设备设计的C语言编译器，适合用于51单片机的开发。随后，通过具体的实例演示了如何配置Makefile文件，以实现代码的自动化编译与链接过程，从而提高开发效率。此外，还提供了常见问题的解决方案及优化建议，帮助开发者快速上手并解决实际开发中可能遇到的技术难题。 ... [详细]

蜡笔小新 2024-10-31 11:43:45
require
利用 Python 实现 Facebook 账号登录功能

利用 Python 实现 Facebook 账号登录功能 ... [详细]

蜡笔小新 2024-10-30 08:47:56
require
在Ubuntu系统中利用GDB深入调试printf函数源代码

本文详细介绍了在Ubuntu操作系统中使用GDB调试工具深入分析和调试标准库函数`printf`的源代码过程。通过具体步骤和实例，展示了如何设置断点、查看变量值及跟踪函数调用栈，帮助开发者更好地理解`printf`函数的工作原理及其内部实现细节。 ... [详细]

蜡笔小新 2024-10-29 12:23:41
runtime
在Windows命令行中利用Conda高效管理虚拟环境的创建与删除

在Windows命令行中，通过Conda工具可以高效地管理和操作虚拟环境。具体步骤包括：1. 列出现有虚拟环境：`conda env list`；2. 创建新虚拟环境：`conda create --name 环境名`；3. 删除虚拟环境：`conda env remove --name 环境名`。这些命令不仅简化了环境管理流程，还提高了开发效率。此外，Conda还支持环境文件导出和导入，方便在不同机器间迁移配置。 ... [详细]

蜡笔小新 2024-10-28 17:27:00
runtime
ZeroMQ在云计算环境下的高效消息传递库第四章学习心得

本章节深入探讨了ZeroMQ在云计算环境中的高效消息传递机制，涵盖客户端请求-响应模式、最近最少使用（LRU）队列、心跳检测、面向服务的队列、基于磁盘的离线队列以及主从备份服务等关键技术。此外，还介绍了无中间件的请求-响应架构，强调了这些技术在提升系统性能和可靠性方面的应用价值。个人理解方面，ZeroMQ通过这些机制有效解决了分布式系统中常见的通信延迟和数据一致性问题。 ... [详细]

蜡笔小新 2024-10-28 13:35:34
runtime
如何在Python中正确安装NumPy库——Python入门指南

在Python中正确安装NumPy库是初学者必须掌握的基本技能。首先，确保你的Python环境已正确配置。接着，访问NumPy官方网站，下载与你当前Python版本相匹配的NumPy安装包。将下载的文件放置于Python安装目录下的Scripts文件夹内。最后，在命令行界面中执行 `pip install numpy` 命令完成安装。此外，建议使用虚拟环境进行安装，以避免不同项目之间的依赖冲突。 ... [详细]

蜡笔小新 2024-10-26 10:38:58