返回介绍

7.1 可能获得哪种类型的速度提升

发布于 2024-01-25 21:44:08 字数 1205 浏览 0 评论 0 收藏 0

如果你的问题求助于编译方式,那么很有可能得到至少一个数量级大小的速度提升。这里,我们会看到在单核上,以及在使用OpenMP的多核上,有各种各样的方法来达成一到两个数量级大小的提速。在编译后趋于更快运行的Python代码有可能是数学方面的,并且可能有许多循环在重复着多次相同的运算。在这些循环中,有可能会生成许多临时对象。

调用外部库(例如,正则表达式、字符串操作、调用数据库)的代码在编译后不可能表现出任何速度提升。I/O密集型的程序同样不可能表现出明显的速度提升。

类似地,如果你的Python代码集中于调用向量化的numpy例程,那么在编译后就不大可能运行得更快——只有当被编译的代码主要是Python(并且可能主要是循环)时才会运行得更快。我们在第6章会看到numpy运算,编译不会真正有助于提速,因为没有许多中间对象。

总体而言,编译后的代码不可能比手工精心编写的C例程运行得更快,但也不可能比它慢很多。从你的Python代码生成的C代码很有可能和手写的C例程跑得一样快,除非C程序员掌握了特定的知识和方法在目标机器架构上去调制C代码。

对于集中于数学方面的代码来说,一个手写的Fortran例程有可能会超越等价的C例程,但是这也有可能需要具备专家级别的知识水准。总体而言,一个编译后的结果(可能使用了Cython、Pythran或Shed Skin)将会如大多数程序员所需要的那样接近于手写C的结果。

当你剖析和工作于你的算法时,请把图7-1记在脑中。通过少量剖析去理解你的代码的工作应该能够让你在算法层面做出更明智的选择。在这之后,致力于编译器使用上的一些工作应该让你获得额外的速度提升。你还可能会一直微调你的算法,但是不要惊讶于见到你那部分不断增加的工作量只是换来了越来越小的改进。要知道多余的努力可能是无效的。

图7-1 一些花在剖析和编译上的工作会带来丰厚回报,但是继续努力,收益就趋向于不断减少

如果你正在处理Python代码和内置的库,不涉及numpy,那么Cython、Shed Skin和PyPy是你的主要选择。如果你正在用numpy工作,那么Cython、Numba和Pythran是正确的选择。这些工具都支持Python2.7,一些支持Python3.2+。

下面一些例子仅需要懂一点C编译器和C代码。如果你缺乏这方面知识,你应该在深入探索之前学习一点C语言和编译一个可以工作的C程序。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文