- 内容提要
- 前言
- 作者简介
- 封面简介
- 第1章 理解高性能 Python
- 第2章 通过性能分析找到瓶颈
- 2.1 高效地分析性能
- 2.2 Julia 集合的介绍
- 2.3 计算完整的 Julia 集合
- 2.4 计时的简单方法——打印和修饰
- 2.5 用 UNIX 的 time 命令进行简单的计时
- 2.6 使用 cProfile 模块
- 2.7 用 runsnakerun 对 cProfile 的输出进行可视化
- 2.8 用 line_profiler 进行逐行分析
- 2.9 用 memory_profiler 诊断内存的用量
- 2.10 用 heapy 调查堆上的对象
- 2.11 用 dowser 实时画出变量的实例
- 2.12 用 dis 模块检查 CPython 字节码
- 2.13 在优化期间进行单元测试保持代码的正确性
- 2.14 确保性能分析成功的策略
- 2.15 小结
- 第3章 列表和元组
- 第4章 字典和集合
- 第5章 迭代器和生成器
- 第6章 矩阵和矢量计算
- 第7章 编译成 C
- 第8章 并发
- 第9章 multiprocessing 模块
- 第10章 集群和工作队列
- 第11章 使用更少的 RAM
- 第12章 现场教训
第7章 编译成 C
读完本章之后你将能够回答下列问题
我怎样让我的Python代码作为低级代码来运行?
JIT编译器和AOT编译器的区别是什么?
编译后的Python代码运行什么任务能够比本地Python快?
为什么类型注解提升了编译后Python代码的运行速度?
我该怎样使用C或Fortran为Python编写模块?
我该怎样在Python中使用C或者Fortran的库?
让你的代码运行更快的最简单的办法就是让它做更少的工作。设想你已经选择了优秀的算法并且已经减少了要处理的数据量,要执行更少指令的最简单的方法就是把你的代码编译成机器码。
Python为此提供了许多选项,包括纯粹的基于C的编译方式,比如Cython、Shed Skin和Pythran,凭借Numba的基于LLVM的编译方式,还有替代虚拟机的PyPy,包含了一个内置的即时编译器(JIT)。当决定采用哪条路线时,你需要在代码的可适用性和团队效率的要求方面做出权衡。
这些工具中的每一种都给你的工具链增加了新的依赖性,并且Cython会额外要求你用一种新的语言类型来编写(一种Python和C的混合),这就意味着你需要新的技能。Cython的新语言可能会伤害你的团队效率,因为没有C语言知识的团队成员在支持这种代码方面可能会有麻烦,尽管在实践中,这很可能只是一个小小的顾虑,因为你只会在代码中精心选择的小部分区域使用Cython。
值得注意的是对你的代码执行CPU和内存剖析有可能会促发你去思考可以采用的高层算法优化。这些算法的变动(例如,用额外的逻辑来避免计算或者用缓存来避免重新计算)会帮助你避免在代码中做无用功,并且Python的表达力会帮助你获得发现这些算法的机会。Radim Řehůřek在12.2节中讨论了Python的实现怎样能够胜出纯C的实现。
在本章中,我们会检视:
Cython ——这是编译成C最通用的工具,覆盖了numpy和普通的Python代码(需要一些C语言的知识)。
Shed Skin —— 一个用于非numpy代码的,自动把Python转换成C的转换器。
Numba —— 一个专用于numpy代码的新编译器。
Pythran —— 一个用于numpy和非numpy代码的新编译器。
PyPy —— 一个用于非numpy代码的,取代常规Python可执行程序的稳定的即时编译器。
接下来在本章中,我们会查看外来接口,这些接口允许C代码被编译进Python的扩展模块。Python的本地API和ctypes、cffi(来自PyPy的作者),以及f2py这种能把Fortran转为Python的转换器一起使用。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论