- 前言
- 目标读者
- 非目标读者
- 本书的结构
- 以实践为基础
- 硬件
- 杂谈:个人的一点看法
- Python 术语表
- Python 版本表
- 排版约定
- 使用代码示例
- 第一部分 序幕
- 第 1 章 Python 数据模型
- 第二部分 数据结构
- 第 2 章 序列构成的数组
- 第 3 章 字典和集合
- 第 4 章 文本和字节序列
- 第三部分 把函数视作对象
- 第 5 章 一等函数
- 第 6 章 使用一等函数实现设计模式
- 第 7 章 函数装饰器和闭包
- 第四部分 面向对象惯用法
- 第 8 章 对象引用、可变性和垃圾回收
- 第 9 章 符合 Python 风格的对象
- 第 10 章 序列的修改、散列和切片
- 第 11 章 接口:从协议到抽象基类
- 第 12 章 继承的优缺点
- 第 13 章 正确重载运算符
- 第五部分 控制流程
- 第 14 章 可迭代的对象、迭代器和生成器
- 14.1 Sentence 类第1版:单词序列
- 14.2 可迭代的对象与迭代器的对比
- 14.3 Sentence 类第2版:典型的迭代器
- 14.4 Sentence 类第3版:生成器函数
- 14.5 Sentence 类第4版:惰性实现
- 14.6 Sentence 类第5版:生成器表达式
- 14.7 何时使用生成器表达式
- 14.8 另一个示例:等差数列生成器
- 14.9 标准库中的生成器函数
- 14.10 Python 3.3 中新出现的句法:yield from
- 14.11 可迭代的归约函数
- 14.12 深入分析 iter 函数
- 14.13 案例分析:在数据库转换工具中使用生成器
- 14.14 把生成器当成协程
- 14.15 本章小结
- 14.16 延伸阅读
- 第 15 章 上下文管理器和 else 块
- 第 16 章 协程
- 第 17 章 使用期物处理并发
- 第 18 章 使用 asyncio 包处理并发
- 第六部分 元编程
- 第 19 章 动态属性和特性
- 第 20 章 属性描述符
- 第 21 章 类元编程
- 结语
- 延伸阅读
- 附录 A 辅助脚本
- Python 术语表
- 作者简介
- 关于封面
16.9 使用案例:使用协程做离散事件仿真
协程能自然地表述很多算法,例如仿真、游戏、异步 I/O,以及其他事件驱动型编程形式或协作式多任务。10
——Guido van Rossum 和 Phillip J. Eby
PEP 342—Coroutines via Enhanced Generators
10PEP 342 中“Motivation”一节开头的第一句话。
本节我会说明如何只使用协程和标准库中的对象实现一个特别简单的仿真系统。在计算机科学领域,仿真是协程的经典应用。第一门面向对象的语言 Simula 引入了协程这个概念,目的就是为了支持仿真。
下述仿真示例不是为了做学术研究。协程是 asyncio 包的基础构建。通过仿真系统能说明如何使用协程代替线程实现并发的活动,而且对理解第 18 章讨论的 asyncio 包有极大的帮助。
分析示例之前,先简单介绍一下仿真。
16.9.1 离散事件仿真简介
离散事件仿真(Discrete Event Simulation,DES)是一种把系统建模成一系列事件的仿真类型。在离散事件仿真中,仿真“钟”向前推进的量不是固定的,而是直接推进到下一个事件模型的模拟时间。假如我们抽象模拟出租车的运营过程,其中一个事件是乘客上车,下一个事件则是乘客下车。不管乘客坐了 5 分钟还是 50 分钟,一旦乘客下车,仿真钟就会更新,指向此次运营的结束时间。使用离散事件仿真可以在不到一秒钟的时间内模拟一年的出租车运营过程。这与连续仿真不同,连续仿真的仿真钟以固定的量(通常很小)不断向前推进。
显然,回合制游戏就是离散事件仿真的例子:游戏的状态只在玩家操作时变化,而且一旦玩家决定下一步怎么走了,仿真钟就会冻结。而实时游戏则是连续仿真,仿真钟一直在运行,游戏的状态在一秒钟之内更新很多次,因此反应慢的玩家特别吃亏。
这两种仿真类型都能使用多线程或在单个线程中使用面向事件的编程技术(例如事件循环驱动的回调或协程)实现。可以说,为了实现连续仿真,在多个线程中处理实时并行的操作更自然。而协程恰好为实现离散事件仿真提供了合理的抽象。SimPy11 是一个实现离散事件仿真的 Python 包,通过一个协程表示离散事件仿真系统中的各个进程。
11参见 SimPy 的官方文档。不要和著名的 SymPy 混淆了。SymPy 是一个符号数学库,与 DES 无关。
在仿真领域,进程这个术语指代模型中某个实体的活动,与操作系统中的进程无关。仿真系统中的一个进程可以使用操作系统中的一个进程实现,但是通常会使用一个线程或一个协程实现。
如果对仿真感兴趣,值得研究一下 SimPy。不过,在这一节我会说明如何只使用标准库提供的功能实现一个特别简单的离散事件仿真系统。我的目的是增进你对使用协程管理并发操作的感性认知。若想理解下一节所讲的内容,要仔细研究,不过这一付出能得到很大回报,让我们洞悉 asyncio、Twisted 和 Tornado 等库是如何在单个线程中管理多个并发活动的。
16.9.2 出租车队运营仿真
仿真程序 taxi_sim.py 会创建几辆出租车,每辆车会拉几个乘客,然后回家。出租车首先驶离车库,四处徘徊,寻找乘客;拉到乘客后,行程开始;乘客下车后,继续四处徘徊。
四处徘徊和行程所用的时间使用指数分布生成。为了让显示的信息更加整洁,时间使用取整的分钟数,不过这个仿真程序也能使用浮点数表示耗时。12 每辆出租车每次的状态变化都是一个事件。图 16-3 是运行这个程序的输出示例。
12我不是运营出租车队的行家,因此别太在意显示的时间。离散事件仿真经常使用指数分布。你会看到一些非常短的行程,你就假设那是一个雨天,一些乘客坐出租车只走了一个街区。在理想的城市中,即使下雨也有出租车。
图 16-3:运行 taxi_sim.py 创建 3 辆出租车的输出示例。-s 3 参数设置随机数生成器的种子,这样在调试和演示时可以重复运行程序,输出相同的结果。不同颜色的箭头表示不同出租车的行程 13
13图 16-3 的彩色图片可从本书页面的“随书下载”部分获取。——编者注
图 16-3 中最值得注意的一件事是,3 辆出租车的行程是交叉进行的。那些箭头是我加上的,为的是让你看清各辆出租车的行程:箭头从乘客上车时开始,到乘客下车后结束。有了箭头,能直观地看出如何使用协程管理并发的活动。
图 16-3 中还有几件事值得注意。
出租车每隔 5 分钟从车库中出发。
0 号出租车 2 分钟后拉到乘客(time=2),1 号出租车 3 分钟后拉到乘客(time=8),2 号出租车 5 分钟后拉到乘客(time=15)。
0 号出租车拉了两个乘客(紫色箭头):第一个乘客从 time=2 时上车,到 time=18 时下车;第二个乘客从 time=28 时上车,到 time=65 时下车——这是此次仿真中最长的行程。
1 号出租车拉了四个乘客(绿色箭头),在 time=110 时回家。
2 号出租车拉了六个乘客(红色箭头),在 time=109 时回家。这辆车最后一次行程从 time=97 时开始,只持续了一分钟。14
1 号出租车的第一次行程从 time=8 时开始,在这个过程中 2 号出租车离开了车库(time=10),而且完成了两次行程(那两个短的红色箭头)。
在此次运行示例中,所有排定的事件都在默认的仿真时间内(180 分钟)完成;最后一次事件发生在 time=110 时。
14乘客是我,我发现忘了带钱包。
仿真结束时可能还有未完成的事件。如果是这种情况,最后一条消息会是下面这样:
*** end of simulation time: 3 events pending ***
taxi_sim.py 脚本的完整代码在示例 A-6 中,本章只会列出与协程相关的部分。真正重要的函数只有两个:taxi_process(一个协程),以及执行仿真主循环的 Simulator.run 方法。
示例 16-20 是 taxi_process 函数的代码。这个协程用到了别处定义的两个对象:compute_delay 函数,返回单位为分钟的时间间隔;Event 类,一个 namedtuple,定义方式如下:
Event = collections.namedtuple('Event', 'time proc action')
在 Event 实例中,time 字段是事件发生时的仿真时间,proc 字段是出租车进程实例的编号,action 字段是描述活动的字符串。
下面逐行分析示例 16-20 中的 taxi_process 函数。
示例 16-20 taxi_sim.py:taxi_process 协程,实现各辆出租车的活动
def taxi_process(ident, trips, start_time=0): ➊ """每次改变状态时创建事件,把控制权让给仿真器""" time = yield Event(start_time, ident, 'leave garage') ➋ for i in range(trips): ➌ time = yield Event(time, ident, 'pick up passenger') ➍ time = yield Event(time, ident, 'drop off passenger') ➎ yield Event(time, ident, 'going home') ➏ # 出租车进程结束 ➐
❶ 每辆出租车调用一次 taxi_process 函数,创建一个生成器对象,表示各辆出租车的运营过程。ident 是出租车的编号(如上述运行示例中的 0、1、2);trips 是出租车回家之前的行程数量;start_time 是出租车离开车库的时间。
❷ 产出的第一个 Event 是 'leave garage'。执行到这一行时,协程会暂停,让仿真主循环着手处理排定的下一个事件。需要重新激活这个进程时,主循环会发送(使用 send 方法)当前的仿真时间,赋值给 time。
❸ 每次行程都会执行一遍这个代码块。
❹ 产出一个 Event 实例,表示拉到乘客了。协程在这里暂停。需要重新激活这个协程时,主循环会发送(使用 send 方法)当前的时间。
❺ 产出一个 Event 实例,表示乘客下车了。协程在这里暂停,等待主循环发送时间,然后重新激活。
❻ 指定的行程数量完成后,for 循环结束,最后产出 'going home' 事件。此时,协程最后一次暂停。仿真主循环发送时间后,协程重新激活;不过,这里没有把产出的值赋值给变量,因为用不到了。
❼ 协程执行到最后时,生成器对象抛出 StopIteration 异常。
你可以在 Python 控制台中调用 taxi_process 函数,自己“驾驶”(drive)一辆出租车 15,如示例 16-21 所示。
15描述协程的操作时经常使用“drive”这个动词,例如:客户代码把值发给协程,驱动协程。在示例 16-21 中,客户代码是你在控制台中输入的代码。(drive 一词有不同的含义,因此在不同的语境中有不同的译法,例如这个脚注所在的那句话中译为“驾驶”。——译者注)
示例 16-21 驱动 taxi_process 协程
>>> from taxi_sim import taxi_process >>> taxi = taxi_process(ident=13, trips=2, start_time=0) ➊ >>> next(taxi) ➋ Event(time=0, proc=13, action='leave garage') >>> taxi.send(_.time + 7) ➌ Event(time=7, proc=13, action='pick up passenger') ➍ >>> taxi.send(_.time + 23) ➎ Event(time=30, proc=13, action='drop off passenger') >>> taxi.send(_.time + 5) ➏ Event(time=35, proc=13, action='pick up passenger') >>> taxi.send(_.time + 48) ➐ Event(time=83, proc=13, action='drop off passenger') >>> taxi.send(_.time + 1) Event(time=84, proc=13, action='going home') ➑ >>> taxi.send(_.time + 10) ➒ Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration
❶ 创建一个生成器对象,表示一辆出租车。这辆出租车的编号是 13(ident=13),从 t=0 时开始工作,有两次行程。
❷ 预激协程;产出第一个事件。
❸ 现在可以发送当前时间。在控制台中,_ 变量绑定的是前一个结果;这里我在时间上加 7,意思是这辆出租车 7 分钟后找到第一个乘客。
❹ 这个事件由 for 循环在第一个行程的开头产出。
❺ 发送 _.time + 23,表示第一个乘客的行程持续了 23 分钟。
❻ 然后,这辆出租车会徘徊 5 分钟。
❼ 最后一次行程持续 48 分钟。
❽ 两次行程完成后,for 循环结束,产出 'going home' 事件。
❾ 如果尝试再把值发给协程,会执行到协程的末尾。协程返回后,解释器会抛出 StopIteration 异常。
注意,在示例 16-21 中,我使用控制台模拟仿真主循环。我从 taxi 协程产出的 Event 实例中获取 .time 属性,随意与一个数相加,然后调用 taxi.send 方法发送两数之和,重新激活协程。在这个仿真系统中,各个出租车协程由 Simulator.run 方法中的主循环驱动。仿真“钟”保存在 sim_time 变量中,每次产出事件时都会更新仿真钟。
为了实例化 Simulator 类,taxi_sim.py 脚本的 main 函数构建了一个 taxis 字典,如下所示:
taxis = {i: taxi_process(i, (i + 1) * 2, i * DEPARTURE_INTERVAL) for i in range(num_taxis)} sim = Simulator(taxis)
DEPARTURE_INTERVAL 的值是 5;如果 num_taxis 的值与前面的运行示例一样也是 3,这三行代码的作用与下述代码一样:
taxis = {0: taxi_process(ident=0, trips=2, start_time=0), 1: taxi_process(ident=1, trips=4, start_time=5), 2: taxi_process(ident=2, trips=6, start_time=10)} sim = Simulator(taxis)
因此,taxis 字典的值是三个参数不同的生成器对象。例如,1 号出租车从 start_time=5 时开始,寻找四个乘客。构建 Simulator 实例只需这个字典参数。
Simulator.__init__ 方法如示例 16-22 所示。Simulator 类的主要数据结构如下。
self.events
PriorityQueue 对象,保存 Event 实例。元素可以放进(使用 put 方法)PriorityQueue 对象中,然后按 item[0](即 Event 对象的 time 属性)依序取出(使用 get 方法)。
self.procs
一个字典,把出租车的编号映射到仿真过程中激活的进程(表示出租车的生成器对象)。这个属性会绑定前面所示的 taxis 字典副本。
示例 16-22 taxi_sim.py:Simulator 类的初始化方法
class Simulator: def __init__(self, procs_map): self.events = queue.PriorityQueue() ➊ self.procs = dict(procs_map) ➋
❶ 保存排定事件的 PriorityQueue 对象,按时间正向排序。
❷ 获取的 procs_map 参数是一个字典(或其他映射),可是又从中构建一个字典,创建本地副本,因为在仿真过程中,出租车回家后会从 self.procs 属性中移除,而我们不想修改用户传入的对象。
优先队列是离散事件仿真系统的基础构件:创建事件的顺序不定,放入这种队列之后,可以按照各个事件排定的时间顺序取出。例如,可能会把下面两个事件放入优先队列:
Event(time=14, proc=0, action='pick up passenger') Event(time=11, proc=1, action='pick up passenger')
这两个事件的意思是,0 号出租车 14 分钟后拉到第一个乘客,而 1 号出租车(time=10 时出发)1 分钟后(time=11)拉到乘客。如果这两个事件在队列中,主循环从优先队列中获取的第一个事件将是 Event(time=11, proc=1, action='pick up passenger')。
下面分析这个仿真系统的主算法——Simulator.run 方法。在 main 函数中,实例化 Simulator 类之后立即就调用了这个方法,如下所示:
sim = Simulator(taxis) sim.run(end_time)
Simulator 类带有注解的代码清单在示例 16-23 中,下面先概述 Simulator.run 方法实现的算法。
(1) 迭代表示各辆出租车的进程。
a. 在各辆出租车上调用 next() 函数,预激协程。这样会产出各辆出租车的第一个事件。
b. 把各个事件放入 Simulator 类的 self.events 属性(队列)中。
(2) 满足 sim_time < end_time 条件时,运行仿真系统的主循环。
a. 检查 self.events 属性是否为空;如果为空,跳出循环。
b. 从 self.events 中获取当前事件(current_event),即 PriorityQueue 对象中时间值最小的 Event 对象。
c. 显示获取的 Event 对象。
d.获取 current_event 的 time 属性,更新仿真时间。
e.把时间发给 current_event 的 proc 属性标识的协程,产出下一个事件(next_event)。
f.把 next_event 添加到 self.events 队列中,排定 next_event。
Simulator 类完整的代码如示例 16-23 所示。
示例 16-23 taxi_sim.py:Simulator,一个简单的离散事件仿真类;关注的重点是 run 方法
class Simulator: def __init__(self, procs_map): self.events = queue.PriorityQueue() self.procs = dict(procs_map) def run(self, end_time): ➊ """排定并显示事件,直到时间结束""" # 排定各辆出租车的第一个事件 for _, proc in sorted(self.procs.items()): ➋ first_event = next(proc) ➌ self.events.put(first_event) ➍ # 这个仿真系统的主循环 sim_time = 0 ➎ while sim_time < end_time: ➏ if self.events.empty(): ➐ print('*** end of events ***') break current_event = self.events.get() ➑ sim_time, proc_id, previous_action = current_event ➒ print('taxi:', proc_id, proc_id * ' ', current_event) ➓ active_proc = self.procs[proc_id] ⓫ next_time = sim_time + compute_duration(previous_action) ⓬ try: next_event = active_proc.send(next_time) ⓭ except StopIteration: del self.procs[proc_id] ⓮ else: self.events.put(next_event) ⓯ else: ⓰ msg = '*** end of simulation time: {} events pending ***' print(msg.format(self.events.qsize()))
❶ run 方法只需要仿真结束时间(end_time)这一个参数。
❷ 使用 sorted 函数获取 self.procs 中按键排序的元素;用不到键,因此赋值给 _。
❸ 调用 next(proc) 预激各个协程,向前执行到第一个 yield 表达式,做好接收数据的准备。产出一个 Event 对象。
❹ 把各个事件添加到 self.events 属性表示的 PriorityQueue 对象中。如示例 16-20 中的运行示例,各辆出租车的第一个事件是 'leave garage'。
❺ 把 sim_time 变量(仿真钟)归零。
❻ 这个仿真系统的主循环:sim_time 小于 end_time 时运行。
❼ 如果队列中没有未完成的事件,退出主循环。
❽ 获取优先队列中 time 属性最小的 Event 对象;这是当前事件(current_event)。
❾ 拆包 Event 对象中的数据。这一行代码会更新仿真钟 sim_time,对应于事件发生时的时间。16
16这通常是离散事件仿真:每次循环时仿真钟不会以固定的量推进,而是根据各个事件持续的时间推进。
❿ 显示 Event 对象,指明是哪辆出租车,并根据出租车的编号缩进。
⓫ 从 self.procs 字典中获取表示当前活动的出租车的协程。
⓬ 调用 compute_duration(...) 函数,传入前一个动作(例如,'pick up passenger'、'drop off passenger' 等),把结果加到 sim_time 上,计算出下一次活动的时间。
⓭ 把计算得到的时间发给出租车协程。协程会产出下一个事件(next_event),或者抛出 StopIteration 异常(完成时)。
⓮ 如果抛出了 StopIteration 异常,从 self.procs 字典中删除那个协程。
⓯ 否则,把 next_event 放入队列中。
⓰ 如果循环由于仿真时间到了而退出,显示待完成的事件数量(有时可能碰巧是零)。
注意,示例 16-23 中的 Simulator.run 方法有两处用到了第 15 章介绍的 else 块,而且都不在 if 语句中。
主 while 循环有一个 else 语句,报告仿真系统由于到达结束时间而结束,而不是由于没有事件要处理而结束。
*靠近主 while 循环底部那个 try 语句把 next_time 发给当前的出租车进程,尝试获取下一个事件(next_event),如果成功,执行 else 块,把 next_event 放入 self.events 队列中。
我觉得,如果没有这两个 else 块,Simulator.run 方法的代码会有点难以阅读。
这个示例的要旨是说明如何在一个主循环中处理事件,以及如何通过发送数据驱动协程。这是 asyncio 包底层的基本思想,我们在第 18 章会学习这个包。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论