热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

开发笔记:定时任务框架APScheduler学习详解

 
 


APScheduler简介

在平常的工作中几乎有一半的功能模块都需要定时任务来推动,例如项目中有一个定时统计程序,定时爬出网站的URL程序,定时检测钓鱼网站的程序等等,都涉及到了关于定时任务的问题,第一时间想到的是利用time模块的time.sleep()方法使程序休眠来达到定时任务的目的,虽然这样也可以,但是总觉得不是那么的专业,^_^所以就找到了python的定时任务模块APScheduler:

APScheduler基于Quartz的一个Python定时任务框架,实现了Quartz的所有功能,使用起来十分方便。提供了基于日期、固定时间间隔以crontab类型的任务,并且可以持久化任务。基于这些功能,我们可以很方便的实现一个python定时任务系统

安装

1、利用pip进行安装












1



$ pip install apscheduler





2、源码安装(https://pypi.python.org/pypi/APScheduler/)












1



$ python setup.py install





APScheduler有四种组成部分:

触发器(trigger)包含调度逻辑,每一个作业有它自己的触发器,用于决定接下来哪一个作业会运行。除了他们自己初始配置意外,触发器完全是无状态的。

作业存储(job store)存储被调度的作业,默认的作业存储是简单地把作业保存在内存中,其他的作业存储是将作业保存在数据库中。一个作业的数据讲在保存在持久化作业存储时被序列化,并在加载时被反序列化。调度器不能分享同一个作业存储。

执行器(executor)处理作业的运行,他们通常通过在作业中提交制定的可调用对象到一个线程或者进城池来进行。当作业完成时,执行器将会通知调度器。

调度器(scheduler)是其他的组成部分。你通常在应用只有一个调度器,应用的开发者通常不会直接处理作业存储、调度器和触发器,相反,调度器提供了处理这些的合适的接口。配置作业存储和执行器可以在调度器中完成,例如添加、修改和移除作业。 

简单应用:










1

2

3

4

5

6

7

8

9



import time

from apscheduler.schedulers.blocking import BlockingScheduler

 

def my_job():

    print time.strftime(‘%Y-%m-%d %H:%M:%S‘, time.localtime(time.time()))

 

sched = BlockingScheduler()

sched.add_job(my_job, ‘interval‘, seconds=5)

sched.start()




上面的例子表示每隔5s执行一次my_job函数,输出当前时间信息

操作作业

1. 添加作业

上面是通过add_job()来添加作业,另外还有一种方式是通过scheduled_job()修饰器来修饰函数











1

2

3

4

5

6

7

8

9

10



import time

from apscheduler.schedulers.blocking import BlockingScheduler

 

sched = BlockingScheduler()

 

@sched.scheduled_job(‘interval‘, seconds=5)

def my_job():

    print time.strftime(‘%Y-%m-%d %H:%M:%S‘, time.localtime(time.time()))

 

sched.start()





2. 移除作业












1

2

3

4

5



job = scheduler.add_job(myfunc, ‘interval‘, minutes=2)

job.remove()

#如果有多个任务序列的话可以给每个任务设置ID号,可以根据ID号选择清除对象,且remove放到start前才有效

sched.add_job(myfunc, ‘interval‘, minutes=2id=‘my_job_id‘)

sched.remove_job(‘my_job_id‘)





3. 暂停和恢复作业

 暂停作业:











1

2



apsched.job.Job.pause()

apsched.schedulers.base.BaseScheduler.pause_job()




 恢复作业:











1

2



apsched.job.Job.resume()

apsched.schedulers.base.BaseScheduler.resume_job()





4. 获得job列表

 获得调度作业的列表,可以使用get_jobs()来完成,它会返回所有的job实例。或者使用print_jobs()来输出所有格式化的作业列表。也可以利用get_job(任务ID)获取指定任务的作业列表











1

2

3



job = sched.add_job(my_job, ‘interval‘, seconds=2 ,id=‘123‘)

print sched.get_job(job_id=‘123‘)

print sched.get_jobs()





5. 关闭调度器

 默认情况下调度器会等待所有正在运行的作业完成后,关闭所有的调度器和作业存储。如果你不想等待,可以将wait选项设置为False。











1

2



sched.shutdown()

sched.shutdown(wait=False)





 作业运行的控制(trigger)

add_job的第二个参数是trigger,它管理着作业的调度方式。它可以为date, interval或者cron。对于不同的trigger,对应的参数也相同。

(1). cron定时调度(某一定时时刻执行)












1

2

3

4

5

6

7

8

9

10

11

12

13

14



(int|str) 表示参数既可以是int类型,也可以是str类型

(datetime | str) 表示参数既可以是datetime类型,也可以是str类型

 

year (int|str) – 4-digit year -(表示四位数的年份,如2008年)

month (int|str) – month (1-12-(表示取值范围为1-12月)

day (int|str) – day of the (1-31-(表示取值范围为1-31日)

week (int|str) – ISO week (1-53-(格里历20061231日可以写成2006-W52-7(扩展形式)或2006W527(紧凑形式))

day_of_week (int|str) – number or name of weekday (0-6 or mon,tue,wed,thu,fri,sat,sun) - (表示一周中的第几天,既可以用0-6表示也可以用其英语缩写表示)

hour (int|str) – hour (0-23- (表示取值范围为0-23时)

minute (int|str) – minute (0-59- (表示取值范围为0-59分)

second (int|str) – second (0-59- (表示取值范围为0-59秒)

start_date (datetime|str) – earliest possible date/time to trigger on (inclusive) - (表示开始时间)

end_date (datetime|str) – latest possible date/time to trigger on (inclusive) - (表示结束时间)

timezone (datetime.tzinfo|str) – time zone to use for the date/time calculations (defaults to scheduler timezone) -(表示时区取值)





参数的取值格式:

技术分享图片

例子:












1

2

3

4

5

6

7

8

9

10

11



#表示2017年3月22日17时19分07秒执行该程序

sched.add_job(my_job, ‘cron‘, year=2017,month = 03,day = 22,hour = 17,minute = 19,second = 07)

 

#表示任务在6,7,8,11,12月份的第三个星期五的00:00,01:00,02:00,03:00 执行该程序

sched.add_job(my_job, ‘cron‘, month=‘6-8,11-12‘, day=‘3rd fri‘, hour=‘0-3‘)

 

#表示从星期一到星期五5:30(AM)直到2014-05-30 00:00:00

sched.add_job(my_job(), ‘cron‘, day_of_week=‘mon-fri‘, hour=5, minute=30,end_date=‘2014-05-30‘)

 

#表示每5秒执行该程序一次,相当于interval 间隔调度中secOnds= 5

sched.add_job(my_job, ‘cron‘,second = ‘*/5‘)





(2). interval 间隔调度(每隔多久执行)












1

2

3

4

5

6

7

8



weeks (int) – number of weeks to wait

days (int) – number of days to wait

hours (int) – number of hours to wait

minutes (int) – number of minutes to wait

seconds (int) – number of seconds to wait

start_date (datetime|str) – starting point for the interval calculation

end_date (datetime|str) – latest possible date/time to trigger on

timezone (datetime.tzinfo|str) – time zone to use for the date/time calculations





例子:












1

2



#表示每隔3天17时19分07秒执行一次任务

sched.add_job(my_job, ‘interval‘,days  = 03,hours = 17,minutes = 19,seconds = 07)





(3). date 定时调度(作业只会执行一次)












1

2



run_date (datetime|str) – the date/time to run the job at  -(任务开始的时间)

timezone (datetime.tzinfo|str) – time zone for run_date if it doesn’t have one already





例子:












1

2

3

4



# The job will be executed on November 6th, 2009

sched.add_job(my_job, ‘date‘, run_date=date(2009116), args=[‘text‘])

# The job will be executed on November 6th, 2009 at 16:30:05

sched.add_job(my_job, ‘date‘, run_date=datetime(200911616305), args=[‘text‘])






推荐阅读
  • 为了确保iOS应用能够安全地访问网站数据,本文介绍了如何在Nginx服务器上轻松配置CertBot以实现SSL证书的自动化管理。通过这一过程,可以确保应用始终使用HTTPS协议,从而提升数据传输的安全性和可靠性。文章详细阐述了配置步骤和常见问题的解决方法,帮助读者快速上手并成功部署SSL证书。 ... [详细]
  • MyISAM和InnoDB是MySQL中最为广泛使用的两种存储引擎,每种引擎都有其独特的优势和适用场景。MyISAM引擎以其简单的结构和高效的读取速度著称,适用于以读操作为主、对事务支持要求不高的应用。而InnoDB引擎则以其强大的事务处理能力和行级锁定机制,在需要高并发写操作和数据完整性的场景下表现出色。选择合适的存储引擎应综合考虑业务需求、性能要求和数据一致性等因素。 ... [详细]
  • 本文介绍了如何利用Struts1框架构建一个简易的四则运算计算器。通过采用DispatchAction来处理不同类型的计算请求,并使用动态Form来优化开发流程,确保代码的简洁性和可维护性。同时,系统提供了用户友好的错误提示,以增强用户体验。 ... [详细]
  • 深入剖析Java中SimpleDateFormat在多线程环境下的潜在风险与解决方案
    深入剖析Java中SimpleDateFormat在多线程环境下的潜在风险与解决方案 ... [详细]
  • 在关系型数据库中,数据约束是指在向数据表中插入数据时必须遵循的限制条件。在MySQL和MariaDB中,常见的数据约束包括主键约束、唯一键约束、外键约束以及非空约束等。这些约束确保了数据的完整性和一致性,是数据库管理中的重要组成部分。通过合理设置和使用这些约束,可以有效防止数据冗余和错误,提升数据库的可靠性和性能。 ... [详细]
  • 在iOS开发中,基于HTTPS协议的安全网络请求实现至关重要。HTTPS(全称:HyperText Transfer Protocol over Secure Socket Layer)是一种旨在提供安全通信的HTTP扩展,通过SSL/TLS加密技术确保数据传输的安全性和隐私性。本文将详细介绍如何在iOS应用中实现安全的HTTPS网络请求,包括证书验证、SSL握手过程以及常见安全问题的解决方法。 ... [详细]
  • 本指南从零开始介绍Scala编程语言的基础知识,重点讲解了Scala解释器REPL(读取-求值-打印-循环)的使用方法。REPL是Scala开发中的重要工具,能够帮助初学者快速理解和实践Scala的基本语法和特性。通过详细的示例和练习,读者将能够熟练掌握Scala的基础概念和编程技巧。 ... [详细]
  • 在对WordPress Duplicator插件0.4.4版本的安全评估中,发现其存在跨站脚本(XSS)攻击漏洞。此漏洞可能被利用进行恶意操作,建议用户及时更新至最新版本以确保系统安全。测试方法仅限于安全研究和教学目的,使用时需自行承担风险。漏洞编号:HTB23162。 ... [详细]
  • 服务器部署中的安全策略实践与优化
    服务器部署中的安全策略实践与优化 ... [详细]
  • 本文详细介绍了在 Oracle 数据库中使用 MyBatis 实现增删改查操作的方法。针对查询操作,文章解释了如何通过创建字段映射来处理数据库字段风格与 Java 对象之间的差异,确保查询结果能够正确映射到持久层对象。此外,还探讨了插入、更新和删除操作的具体实现及其最佳实践,帮助开发者高效地管理和操作 Oracle 数据库中的数据。 ... [详细]
  • POJ 2482 星空中的星星:利用线段树与扫描线算法解决
    在《POJ 2482 星空中的星星》问题中,通过运用线段树和扫描线算法,可以高效地解决星星在窗口内的计数问题。该方法不仅能够快速处理大规模数据,还能确保时间复杂度的最优性,适用于各种复杂的星空模拟场景。 ... [详细]
  • PHP预处理常量详解:如何定义与使用常量 ... [详细]
  • 在本任务中,我们将深入探讨数据重塑的技巧及其实际应用,特别是在处理复杂数据集时。通过使用泰坦尼克号数据集,我们将展示如何利用数据聚合和运算来计算男性和女性乘客的平均票价。具体来说,我们将编写代码以实现这一目标,并通过 `groupby` 方法对数据进行分组和统计分析,从而获得更深入的洞察。此外,我们还将介绍其他相关技术,如数据透视表和多级索引,以提升数据处理的效率和准确性。 ... [详细]
  • 如何撰写适应变化的高效代码:策略与实践
    编写高质量且适应变化的代码是每位程序员的追求。优质代码的关键在于其可维护性和可扩展性。本文将从面向对象编程的角度出发,探讨实现这一目标的具体策略与实践方法,帮助开发者提升代码效率和灵活性。 ... [详细]
  • 本文详细探讨了使用纯JavaScript开发经典贪吃蛇游戏的技术细节和实现方法。通过具体的代码示例,深入解析了游戏逻辑、动画效果及用户交互的实现过程,为开发者提供了宝贵的参考和实践经验。 ... [详细]
author-avatar
晓风朗月
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有