文章来源于网络收集而来，版权归原创者所有，如有侵权请及时联系！

7.1 可能获得哪种类型的速度提升

发布于 2024-01-25 21:44:08 字数 1205 浏览 0 评论 0 收藏 0

如果你的问题求助于编译方式，那么很有可能得到至少一个数量级大小的速度提升。这里，我们会看到在单核上，以及在使用OpenMP的多核上，有各种各样的方法来达成一到两个数量级大小的提速。在编译后趋于更快运行的Python代码有可能是数学方面的，并且可能有许多循环在重复着多次相同的运算。在这些循环中，有可能会生成许多临时对象。

调用外部库（例如，正则表达式、字符串操作、调用数据库）的代码在编译后不可能表现出任何速度提升。I/O密集型的程序同样不可能表现出明显的速度提升。

类似地，如果你的Python代码集中于调用向量化的numpy例程，那么在编译后就不大可能运行得更快——只有当被编译的代码主要是Python（并且可能主要是循环）时才会运行得更快。我们在第6章会看到numpy运算，编译不会真正有助于提速，因为没有许多中间对象。

总体而言，编译后的代码不可能比手工精心编写的C例程运行得更快，但也不可能比它慢很多。从你的Python代码生成的C代码很有可能和手写的C例程跑得一样快，除非C程序员掌握了特定的知识和方法在目标机器架构上去调制C代码。

对于集中于数学方面的代码来说，一个手写的Fortran例程有可能会超越等价的C例程，但是这也有可能需要具备专家级别的知识水准。总体而言，一个编译后的结果（可能使用了Cython、Pythran或Shed Skin）将会如大多数程序员所需要的那样接近于手写C的结果。

当你剖析和工作于你的算法时，请把图7-1记在脑中。通过少量剖析去理解你的代码的工作应该能够让你在算法层面做出更明智的选择。在这之后，致力于编译器使用上的一些工作应该让你获得额外的速度提升。你还可能会一直微调你的算法，但是不要惊讶于见到你那部分不断增加的工作量只是换来了越来越小的改进。要知道多余的努力可能是无效的。