- 内容提要
- 前言
- 作者简介
- 封面简介
- 第1章 理解高性能 Python
- 第2章 通过性能分析找到瓶颈
- 2.1 高效地分析性能
- 2.2 Julia 集合的介绍
- 2.3 计算完整的 Julia 集合
- 2.4 计时的简单方法——打印和修饰
- 2.5 用 UNIX 的 time 命令进行简单的计时
- 2.6 使用 cProfile 模块
- 2.7 用 runsnakerun 对 cProfile 的输出进行可视化
- 2.8 用 line_profiler 进行逐行分析
- 2.9 用 memory_profiler 诊断内存的用量
- 2.10 用 heapy 调查堆上的对象
- 2.11 用 dowser 实时画出变量的实例
- 2.12 用 dis 模块检查 CPython 字节码
- 2.13 在优化期间进行单元测试保持代码的正确性
- 2.14 确保性能分析成功的策略
- 2.15 小结
- 第3章 列表和元组
- 第4章 字典和集合
- 第5章 迭代器和生成器
- 第6章 矩阵和矢量计算
- 第7章 编译成 C
- 第8章 并发
- 第9章 multiprocessing 模块
- 第10章 集群和工作队列
- 第11章 使用更少的 RAM
- 第12章 现场教训
10.8 看一下其他的集群化工具
使用队列的任务处理系统自从计算机科学领域的开端以来就存在了,追溯到那个计算机很缓慢而且有许多任务需要被处理的时代。结果就是有许多队列库,其中很多能够在集群配置中使用。我们强烈推荐你挑选一个背后有积极社区的成熟库,支持你所需要的相同的特性集,并且没有太多的附加特性。
一个库具有越多的特性,则你会发现错误配置的情况也越多,从而在调试上浪费时间。当处理集群的解决方案时,简单化通常就是正确的目标。有一些使用更普遍的集群化解决方案:
Celery(BSD许可)是一个使用分布式消息架构的被广泛使用的异步任务队列,用Python所编写。它支持Python、PyPy,以及Jython。典型情况下它使用RabbitMQ作为消息代理,但是也支持Redis、MongoDB和其他的存储系统。它通常在Web开发项目中所使用。Andrew Godwin在12.6节中讨论了Celery。
Gearman(BSD许可)是一个多平台的任务处理系统。如果你正在使用不同的技术来集成处理任务,它是非常有用的。它具有对Python、PHP、C++、Perl以及其他许多语言的绑定。
PyRes是针对Python的基于Redis的轻量级的任务管理器。添加任务进Redis的队列中,设置消费者来处理它们,并且选择性地把结果在一个新的队列中传递回去。如果你的需求是轻量级的而且只用Python,它是一个作为起点的非常简单的系统。
亚马逊的简单队列服务(SQS)是集成进亚马逊Web服务的一个任务处理系统。任务消费者和生产者能够存在于AWS内部或者外部,这样SQS启动简单,并且支持简单的迁移入云。对许多语言有库支持。
集群也能用于分布式的numpy处理,但是这是一个在Python世界中相对年轻的发展。通过distarrary和blaze包,Enthough和Continuum都有解决方案。注意这些包企图为你处理同步化和数据局部性的复杂问题(没有一个适合所有情况的解决方案),所以要注意你可能会不得不思考你的数据布局和访取的方式。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论