热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Python进阶(9)定时运行程序APScheduler

文章目录1.前言1.Scheduler1.1.基本概念1.2.基本API1.3.实例2.trigger2.1.基本概念2.2.apscheduler.triggers.cron.C

文章目录

    • 1. 前言
    • 1. Scheduler
      • 1.1. 基本概念
      • 1.2. 基本API
      • 1.3. 实例
    • 2. trigger
      • 2.1. 基本概念
      • 2.2. apscheduler.triggers.cron.CronTrigger
      • 2.3. 其他 trigger
      • 2.5. 举例:add_job 中trigger的应用
    • 3. executors & job store
      • 3.1. Executors
      • 3.2. Job Stores
      • 3.3. 举例




1. 前言


  • 官网,源码,官方examples
  • 安装pip install apscheduler
  • 组件介绍
    • triggers:什么时候触发任务。
    • job stores:默认情况下将任务保存在内存中。还没用到需要序列化到数据库的情况。
    • executors:执行Job,主要取决于用了什么框架。默认使用线程池,常用的还有进程池。
    • schedulers:用于管理以上三个组件。



1. Scheduler


1.1. 基本概念


  • 作用:用于管理 triggers,job stores,executors。
  • 如何选择:主要就是根据运行的环境来选择。
    • BlockingScheduler:程序只有调度器运行时选择。
    • BackgroundScheduler:没有使用其他框架,且希望调度器在应用后台运行。

1.2. 基本API


  • 所有的Scheduler都继承自 BaseScheduler
  • 初始化函数 def __init__(self, gconfig={}, **options):
    • gconfig 可以看做是一个全局初始化参数。
    • **options 可以看做是自定义初始化参数。
    • 上面两者所包含的参数是完全相同的,且自定义初始化参数会覆盖全局初始化参数。
    • 包含的参数有:
      • logger:str/logging.Logger,用于输出日志信息。
      • timezone:str/datetime.tzinfo,指定时区。
      • jobstore_retry_interval:int/float,当job store抛出异常时,最短的重试时间间隔。
      • job_defaults:dict,新建jobs的默认参数
      • jobstores:dict,job store alias -> job store instance or configuration dict
      • executors:dict, executor alias -> executor instance or configuration dict
  • configure(gconfig={}, prefix='apscheduler.', **options):在开始运行前设置参数。
    • 参数类型与初始化时相同。
  • start(paused=False):运行scheduler。
    • 如果paused=True则需要等到运行 resume() 方法后才会真正运行scheduler。
  • shutdown(wait=True):关闭scheduler
    • 同时关闭了 executors和job stores。
    • 不会停止正在运行的jobs。
    • wait=True时会等待所有jobs运行完成。
  • pause():暂停,与resume()配合使用。
  • resume():重新开始,与pause()配合使用。
  • add/remove_executor
  • add/remove_jobstore
  • add/remove_listener
  • job相关API
    • add_job():参数太多
      • func
      • trigger:str或trigger对象,初始化参数通过 **trigger_args 来获得。
      • args:func 参数
      • kwargs:func 参数
      • id
      • name
      • misfire_grace_timec
      • coalesce
      • max_instances
      • next_run_time
      • jobstore:str,通过 alias 来选择。
      • executor:str,通过 alias 来选择。
      • replace_existing
      • **trigger_args:用于 trigger
    • modify_job(job_id, jobstore=None, **changes)
      • 改变某个job的参数。
    • reschedule_job(job_id, jobstore=None, trigger=None, **trigger_args)
      • 改变某个job的trigger,并修改下次运行时间。.
    • pause/resume_job:暂停/继续某个job。
    • get_jobs(jobstore=None, pending=None)
    • get_job(job_id, jobstore=None)
    • remove_job(job_id, jobstore=None)
    • remove_all_jobs(jobstore=None)
    • print_jobs(jobstore=None, out=sys.stdout)

1.3. 实例

from datetime import datetime
import time
import osfrom apscheduler.schedulers.background import BackgroundScheduler
from apscheduler.schedulers.blocking import BlockingSchedulerdef tick():print('Tick! The time is: %s' % datetime.now())# background sheculer 实例
scheduler = BackgroundScheduler()
scheduler.add_job(tick, 'interval', seconds=3)
scheduler.start()
print('Press Ctrl+{0} to exit'.format('Break' if os.name == 'nt' else 'C'))
try:# This is here to simulate application activity (which keeps the main thread alive).while True:time.sleep(2)
except (KeyboardInterrupt, SystemExit):# Not strictly necessary if daemonic mode is enabled but should be done if possiblescheduler.shutdown()# blocking sheduler 实例
scheduler = BlockingScheduler()
scheduler.add_job(tick, 'interval', seconds=3)
print('Press Ctrl+{0} to exit'.format('Break' if os.name == 'nt' else 'C'))try:scheduler.start()
except (KeyboardInterrupt, SystemExit):pass



2. trigger


2.1. 基本概念


  • 基本作用:决定job运行的时间点/时间间隔。
  • 分类
    • cron:功能最强大,可以指定时间、时间间隔、时间范围等。参考
    • date:指定某个时间点出发,只执行一次。
    • interval:指定时间间隔出发任务,可指定时间范围。

2.2. apscheduler.triggers.cron.CronTrigger


  • 参数很多,功能强大。
  • 对我来说,因为在linux中也常用,所以我用起来也最顺手。
  • 主要参数:
    • year:int/str,4位
    • month:int/str,[1, 12]
    • day:int/str,[1, 31]
    • week:int/str,[1, 53]
    • day_of_week:int/str,[0, 6],从周一开始,也可以用英文的钱三个小写字母。
    • hour:int/str,[0, 23]
    • minute:int/str,[0, 59]
    • second:int/str,[0, 59]
    • start_date:datetime/str
    • end_date:datetime/str
    • timezone:datetime.tzinfo|str
    • jitter:int/None,运行时间随机偏移[-jitter, jitter]秒。
  • 对于没有指定的参数,根据输入参数分别设置为*或最小值:
    • 大于指定元素中最小的,设置为 *
    • 小于指定元素中最小的,设置为其最小值。
    • 举例:输入 day=1, minute=20,则设置second=0,其他元素为*
  • 其他常用的一些语法

ExpressionFieldDescription
*anyfire on every value
*/aanyFire every a values, starting from the minimum
a-banyFire on any value within the a-b range (a must be smaller than b)
a-b/canyFire every c values within the a-b range
xth ydayFire on the x -th occurrence of weekday y within the month
last xdayFire on the last occurrence of weekday x within the month
lastdayFire on the last day within the month
x,y,zanyFire on any matching expression; can combine any number of any of the above expressions

2.3. 其他 trigger


  • apscheduler.triggers.interval.IntervalTrigger
    • 通过设置间隔时间来确定下次运行时间。
    • 主要参数:
      • weeks:int
      • days:int
      • hours:int
      • minutes:int
      • seconds:int
      • start_date:datetime/str
      • end_date:datetime/str
      • timezone:datetime.tzinfo|str
      • jitter:int/None,运行时间随机偏移[-jitter, jitter]秒。
  • apscheduler.triggers.date.DateTrigger(run_date=None, timezone=None)
    • 只在给定的时间运行一次
    • run_date:datetime|str,指定运行时间。
    • timezone:datetime.tzinfo|str
  • 集合操作:
    • apscheduler.triggers.combining.AndTrigger(triggers, jitter=None)
    • apscheduler.triggers.combining.OrTrigger(triggers, jitter=None)
    • 主要就是用于合并多个 triiger。

2.5. 举例:add_job 中trigger的应用


  • 回顾一下 scheduler.add_job 方法,与trigger有关的参数有:
    • trigger=None:
      • 可以设置为字符串 date/interval/cron
      • 也可以设置为上面提到过的各种 trigger 对象。
    • **trigger_args:即 add_job 方法中所有没有定义的命名参数都会作为trigger对象的参数导入。
  • 举例:

# date
# 方法一
sched.add_job(my_job, 'date', run_date=datetime(2009, 11, 6, 16, 30, 5), args=['text'])
# 方法二
sched.add_job(my_job, 'date', run_date='2009-11-06 16:30:05', args=['text'])
# 方法三(马上执行)
sched.add_job(my_job, args=['text'])# interval
# 方法一
sched.add_job(job_function, 'interval', hours=2, start_date='2010-10-10 09:30:00', end_date='2014-06-15 11:00:00')
# 方法二
@sched.scheduled_job('interval', id='my_job_id', hours=2)
def job_function():print("Hello World")# cron
# 方法一
sched.add_job(job_function, 'cron', day_of_week='mon-fri', hour=5, minute=30, end_date='2014-05-30')
# 方法二
@sched.scheduled_job('cron', id='my_job_id', day='last sun')
def some_decorated_task():print("I am printed at 00:00:00 on the last Sunday of every month!")
# 方法三
sched.add_job(job_function, CronTrigger.from_crontab('0 0 1-15 may-aug *'))# AndTrigger
trigger = AndTrigger([IntervalTrigger(hours=2),CronTrigger(day_of_week='sat,sun')])
scheduler.add_job(job_function, trigger)# OrTrigger
trigger = OrTrigger([CronTrigger(day_of_week='mon', hour=2),CronTrigger(day_of_week='tue', hour=15)])
scheduler.add_job(job_function, trigger)



3. executors & job store


3.1. Executors


  • 用于指定通过什么后端来执行任务。
  • 常用的有:线程池与进程池。
    • 默认使用线程池。
  • 如何使用:
    • 第一步:在定义 scheduler 时输入 executors 参数。
      • 该参数是一个字典,key为executor的别名,value为executors的对象。
    • 第二步:在 add_job 的时候指定对应executor的别名。
  • 其他:
    • 默认情况下,用线程池已经够了。
    • 计算密集型任务要使用进程池。

3.2. Job Stores


  • 作用:将job保存到哪里。
    • 可以保存到各类数据库中。因为没用到,所以没细看。
    • 默认保存到内存中。
  • 如何使用:
    • 第一步:在定义 scheduler 时输入 jobstores 参数。
      • 该参数是一个字典,key为executor的别名,value为executors的对象。
    • 第二步:在 add_job 的时候指定对应jobstore的别名。

3.3. 举例

from pytz import utcfrom apscheduler.schedulers.background import BackgroundScheduler
from apscheduler.jobstores.sqlalchemy import SQLAlchemyJobStore
from apscheduler.executors.pool import ThreadPoolExecutor, ProcessPoolExecutorjobstores = {'mongo': {'type': 'mongodb'},'default': SQLAlchemyJobStore(url='sqlite:///jobs.sqlite')
}executors = {'default': {'type': 'threadpool', 'max_workers': 20},'processpool': ProcessPoolExecutor(max_workers=5)
}
# executors = {
# 'default': ThreadPoolExecutor(20),
# 'processpool': ProcessPoolExecutor(5)
# }job_defaults = {'coalesce': False,'max_instances': 3
}
scheduler = BackgroundScheduler()# .. do something else here, maybe add jobs etc.scheduler.configure(jobstores=jobstores, executors=executors, job_defaults=job_defaults, timezone=utc)


推荐阅读
  • Django + Ansible 主机管理(有源码)
    本文给大家介绍如何利用DjangoAnsible进行Web项目管理。Django介绍一个可以使Web开发工作愉快并且高效的Web开发框架,能够以最小的代价构建和维护高 ... [详细]
  • 安装mysqlclient失败解决办法
    本文介绍了在MAC系统中,使用django使用mysql数据库报错的解决办法。通过源码安装mysqlclient或将mysql_config添加到系统环境变量中,可以解决安装mysqlclient失败的问题。同时,还介绍了查看mysql安装路径和使配置文件生效的方法。 ... [详细]
  • Python实现变声器功能(萝莉音御姐音)的方法及步骤
    本文介绍了使用Python实现变声器功能(萝莉音御姐音)的方法及步骤。首先登录百度AL开发平台,选择语音合成,创建应用并填写应用信息,获取Appid、API Key和Secret Key。然后安装pythonsdk,可以通过pip install baidu-aip或python setup.py install进行安装。最后,书写代码实现变声器功能,使用AipSpeech库进行语音合成,可以设置音量等参数。 ... [详细]
  • 树莓派语音控制的配置方法和步骤
    本文介绍了在树莓派上实现语音控制的配置方法和步骤。首先感谢博主Eoman的帮助,文章参考了他的内容。树莓派的配置需要通过sudo raspi-config进行,然后使用Eoman的控制方法,即安装wiringPi库并编写控制引脚的脚本。具体的安装步骤和脚本编写方法在文章中详细介绍。 ... [详细]
  • Python操作MySQL(pymysql模块)详解及示例代码
    本文介绍了使用Python操作MySQL数据库的方法,详细讲解了pymysql模块的安装和连接MySQL数据库的步骤,并提供了示例代码。内容涵盖了创建表、插入数据、查询数据等操作,帮助读者快速掌握Python操作MySQL的技巧。 ... [详细]
  • 本文介绍了在Windows系统下安装Python、setuptools、pip和virtualenv的步骤,以及安装过程中需要注意的事项。详细介绍了Python2.7.4和Python3.3.2的安装路径,以及如何使用easy_install安装setuptools。同时提醒用户在安装完setuptools后,需要继续安装pip,并注意不要将Python的目录添加到系统的环境变量中。最后,还介绍了通过下载ez_setup.py来安装setuptools的方法。 ... [详细]
  • EzPP 0.2发布,新增YAML布局渲染功能
    EzPP发布了0.2.1版本,新增了YAML布局渲染功能,可以将YAML文件渲染为图片,并且可以复用YAML作为模版,通过传递不同参数生成不同的图片。这个功能可以用于绘制Logo、封面或其他图片,让用户不需要安装或卸载Photoshop。文章还提供了一个入门例子,介绍了使用ezpp的基本渲染方法,以及如何使用canvas、text类元素、自定义字体等。 ... [详细]
  • 开源Keras Faster RCNN模型介绍及代码结构解析
    本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构,包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]
  • Python使用Pillow包生成验证码图片的方法
    本文介绍了使用Python中的Pillow包生成验证码图片的方法。通过随机生成数字和符号,并添加干扰象素,生成一幅验证码图片。需要配置好Python环境,并安装Pillow库。代码实现包括导入Pillow包和随机模块,定义随机生成字母、数字和字体颜色的函数。 ... [详细]
  • 本文总结了使用不同方式生成 Dataframe 的方法,包括通过CSV文件、Excel文件、python dictionary、List of tuples和List of dictionary。同时介绍了一些注意事项,如使用绝对路径引入文件和安装xlrd包来读取Excel文件。 ... [详细]
  • Python已成为全球最受欢迎的编程语言之一,然而Python程序的安全运行存在一定的风险。本文介绍了Python程序安全运行需要满足的三个条件,即系统路径上的每个条目都处于安全的位置、"主脚本"所在的目录始终位于系统路径中、若python命令使用-c和-m选项,调用程序的目录也必须是安全的。同时,文章还提出了一些预防措施,如避免将下载文件夹作为当前工作目录、使用pip所在路径而不是直接使用python命令等。对于初学Python的读者来说,这些内容将有所帮助。 ... [详细]
  • 通过Anaconda安装tensorflow,并安装运行spyder编译器的完整教程
    本文提供了一个完整的教程,介绍了如何通过Anaconda安装tensorflow,并安装运行spyder编译器。文章详细介绍了安装Anaconda、创建tensorflow环境、安装GPU版本tensorflow、安装和运行Spyder编译器以及安装OpenCV等步骤。该教程适用于Windows 8操作系统,并提供了相关的网址供参考。通过本教程,读者可以轻松地安装和配置tensorflow环境,以及运行spyder编译器进行开发。 ... [详细]
  • 原文链接:Python:获取“3年前的今天”的日期时间Python:getdatetimefor3yearsagotoday在Python中,如何获取3年前的今天的datetime ... [详细]
  • MySQL修改表结构操作命令总结【MySQL】
    数据库|mysql教程MySQL,修改表结构命令数据库-mysql教程表的结构如下:错误页面源码,ubuntu电脑自动休眠,爬虫造景视频,rapapiphp,廊坊seo开发lzwm ... [详细]
  •   《WindowsAzurePlatform系列文章目录》  本文将介绍如何在AzureSQLDatabase创建只读用户。  请先按照笔者之前的文章:AzureSQLDatabas ... [详细]
author-avatar
mobiledu2502918245
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有