RQ 在 Python 中的进程 Worker

发布于 2021-04-14 12:42:56 字数 2599 浏览 2671 评论 0

worker 就是一个 Python 进程,运行在后台用于执行那些费时的、阻塞的任务。因为这些任务并没有必要把他放在 web 应用中处理,比如用户注册时发送邮件验证其有效性的操作。

启动 worker

启动 worker 进程非常简单,只需从工程根目录下运行命令:

$ rqworker high normal low
20:52:58 RQ worker started, version 0.4.6
20:52:58
20:52:58 *** Listening on high, normal, low...

Worker 会从指定的队列中读取 jobs(任务),读取顺序是按照其先后顺序(high,normal,low)来处理的,worker 会不断循环处理,直到所有任务处理完成后才处于等待状态。
每个 worker 在同一时间只处理单个任务,在 worker 中没有并发处理,如果你想并发地处理任务,那么启动多个 worker 即可。

Burst 启动模式

默认情况下,workers 启动后立马开始工作,直到所有任务完成时开始阻塞等待新的任务进来,不过workers还可以以一种叫burst的模式启动,这种方式启动时,workers完成所有任务后,一旦返现队列没有任务了,那么该进程就退出。
这种使用场景一般用于临时性处理一些任务,或者业务高分期临时扩展业务来处理一下这些任务。

深入worker

worker 的生命周期

worker 的生命周期由如下几个步骤构成:

  1. 启动,加载Python环境
  2. 登记,worker自生注册,让系统知道有这么一个worker
  3. 监听,监听从给定的Redis队列中弹出的任务,如果所有队列都是空的,分两步走,如果以burst模式启动,那么worker会立即退出,否则一直等待直到有任务进入队列。
  4. 准备执行任务,worker告诉系统它将开始工作,这是他会把自己的状态设置成busy,然后在StartedJobRegistry注册任务。
  5. fork一个子进程,子进程(又称为work horse)是forked出来用来处理真实的任务在一个有故障自检的上下文中
  6. 处理任务,这一步执行真正的任务工作在work horse中
  7. 清空任务执行,worker会设置自身的状态为 idle(空闲)。然后设置任务以及他的结果过期基于resutl_ttl,Job同时从Startedjobregistry移除,添加到FinishedJobRegistry中,如果成功执行的话,否则会放到 FailedQueue 中去。
  8. 循环,重复第三步

性能贴士

基本上,rqworker shell 脚本是一个简单的fetch-fork执行循环,当很多任务做很多设置或者他们都依靠相同的模块,你可以在每次执行任务的时候支付这个开销(因为你在forking之后正在导入)。这是很清晰的,因为RQ并不会泄露内存,更不会变慢。
你可以使用一种模式提高其吞吐量的性能,没有任何方法告诉RQ workers去执行,但是你可以自己启动循环。

为了达到这种效果,自己提供一个脚本(取代rqworker)。简单实现例子:

#!/usr/bin/env python
import sys
from rq import Queue, Connection, Worker

#预加载库
import library_that_you_want_prelaoded

#提供队列名字准备去监听
# 类似与 rqworker
with Connection():
    qs = map(Queue, sys.argv[1:]) or [Queue()]
    w = Worker(qs)
    w.work()

进程名字

Workers 注册到系统以他们的名字,你可以看 monitoring,默认情况下,worker的名字等于当前的hostname和当前的PID追加而成,要是要覆盖这个默认的名字,可以在启动worker的时候,使用--name 选项来指定。

终止 workers

任何时候,workers接收SIGINT(又叫Ctrl+C)或者SIGTERM(又叫kill),worker等待知道当前正在运行的任务完成,就会停止work循环,然后优雅地注册自己死亡。
如果在down的过程中,SIGINT或者SIGTERM再次接收了,那么worker将强制终止子进程(通过发送SIGKILL).但是仍然会注册自己死亡。

使用配置文件

如果你喜欢通过配置文件的方式来配置rqworker,那么你可以通过类似settings.py的方式指定配置:

REDIS_HOST = “redis.example.com”
REDIS_PORT = 6379

# 你还可以指定Redis DB去使用
# REDIS_DB = 3
# REDIS_PASSWORD = ‘VERY SECRET’

# 要监听的队列
Queue = [‘high’,’normal’, ‘low’]

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据

关于作者

JSmiles

生命进入颠沛而奔忙的本质状态,并将以不断告别和相遇的陈旧方式继续下去。

文章
评论
84963 人气
更多

推荐作者

微信用户

文章 0 评论 0

小情绪

文章 0 评论 0

ゞ记忆︶ㄣ

文章 0 评论 0

笨死的猪

文章 0 评论 0

彭明超

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文