当前位置：文江博客话题详情

提高 Python 中的 FFT 性能

发布于 2024-11-15 18:55:29 字数 138 浏览 9 评论 0原文

Python 中最快的 FFT 实现是什么？

看来 numpy.fft 和 scipy.fftpack 都基于 fftpack，而不是 FFTW。 fftpack 和 FFTW 一样快吗？使用多线程 FFT 或分布式 (MPI) FFT 怎么样？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

诗化ㄋ丶相逢 2024-11-22 18:55:29

您当然可以使用 Cython 或其他允许您访问外部库的类似工具来包装您想要测试的任何 FFT 实现。

基于 GPU

如果您要测试 FFT 实现，您还可以查看基于 GPU 的代码（如果您可以访问适当的硬件）。有几个：reikna.fft、scikits.cuda。

基于 CPU

还有一个基于 CPU 的 python FFTW 包装器 pyFFTW。

（还有 pyFFTW3 ，但它不像 pyFFTW 那样积极维护，而且它不使用Python3（源））

我没有任何这些方面的经验。如果速度对您来说很重要，那么您可能需要为您的特定应用程序进行一些挖掘和基准测试不同的代码。

回复收藏 0 原文

以歌曲疗慰 2024-11-22 18:55:29

对于https://gist.github.com/fnielsen/99b981b9da34ae3d5035详细的测试，我发现 scipy.fftpack 表现良好与我通过 pyfftw 的简单应用程序相比pyfftw.interfaces.scipy_fftpack，长度对应于素数的数据除外。

第一次调用 pyfftw.interfaces.scipy_fftpack.fft 似乎需要一些设置成本。第二次就更快了。 Numpy 和 scipy 的带有素数的 fftpack 对于我尝试的数据大小来说表现得非常糟糕。在这种情况下，CZT 更快。几个月前，Scipy 的 Github 上提出了一个关于该问题的问题，请参阅 https://github.com/scipy/scipy/问题/4288

20000 prime=False
  padded_fft : 0.003116
   numpy_fft : 0.003502
   scipy_fft : 0.001538
         czt : 0.035041
    fftw_fft : 0.004007
------------------------------------------------------------
20011 prime=True
  padded_fft : 0.001070
   numpy_fft : 1.263672
   scipy_fft : 0.875641
         czt : 0.033139
    fftw_fft : 0.009980
------------------------------------------------------------
21803 prime=True
  padded_fft : 0.001076
   numpy_fft : 1.510341
   scipy_fft : 1.043572
         czt : 0.035129
    fftw_fft : 0.011463
------------------------------------------------------------
21804 prime=False
  padded_fft : 0.001108
   numpy_fft : 0.004672
   scipy_fft : 0.001620
         czt : 0.033854
    fftw_fft : 0.005075
------------------------------------------------------------
21997 prime=True
  padded_fft : 0.000940
   numpy_fft : 1.534876
   scipy_fft : 1.058001
         czt : 0.034321
    fftw_fft : 0.012839
------------------------------------------------------------
32768 prime=False
  padded_fft : 0.001222
   numpy_fft : 0.002410
   scipy_fft : 0.000925
         czt : 0.039275
    fftw_fft : 0.005714
------------------------------------------------------------

For a test detailed at https://gist.github.com/fnielsen/99b981b9da34ae3d5035 I find that scipy.fftpack performs fine compared to my simple application of pyfftw via pyfftw.interfaces.scipy_fftpack, except for data with a length corresponding to a prime number.

There seems to be some setup cost associated with evoking pyfftw.interfaces.scipy_fftpack.fft the first time. The second time it is faster. Numpy's and scipy's fftpack with a prime number performs terribly for the size of data I tried. CZT is faster in that case. Some months ago an issue was put up at Scipy's Github about the problem, see https://github.com/scipy/scipy/issues/4288

20000 prime=False
  padded_fft : 0.003116
   numpy_fft : 0.003502
   scipy_fft : 0.001538
         czt : 0.035041
    fftw_fft : 0.004007
------------------------------------------------------------
20011 prime=True
  padded_fft : 0.001070
   numpy_fft : 1.263672
   scipy_fft : 0.875641
         czt : 0.033139
    fftw_fft : 0.009980
------------------------------------------------------------
21803 prime=True
  padded_fft : 0.001076
   numpy_fft : 1.510341
   scipy_fft : 1.043572
         czt : 0.035129
    fftw_fft : 0.011463
------------------------------------------------------------
21804 prime=False
  padded_fft : 0.001108
   numpy_fft : 0.004672
   scipy_fft : 0.001620
         czt : 0.033854
    fftw_fft : 0.005075
------------------------------------------------------------
21997 prime=True
  padded_fft : 0.000940
   numpy_fft : 1.534876
   scipy_fft : 1.058001
         czt : 0.034321
    fftw_fft : 0.012839
------------------------------------------------------------
32768 prime=False
  padded_fft : 0.001222
   numpy_fft : 0.002410
   scipy_fft : 0.000925
         czt : 0.039275
    fftw_fft : 0.005714
------------------------------------------------------------

回复收藏 0 原文

空袭的梦i 2024-11-22 18:55:29

与 pyFFTW 库相比，pyFFTW3 包较差，至少在实现方面如此。由于它们都包装了 FFTW3 库，我想速度应该是相同的。

https://pypi.python.org/pypi/pyFFTW

回复收藏 0 原文

尝蛊 2024-11-22 18:55:29

在我工作的地方，一些研究人员编译了这个 Fortran 库，它为特定问题设置和调用 FFTW。这个 Fortran 库（带有一些子例程的模块）需要来自我的 Python 程序的一些输入数据（2D 列表）。

我所做的是为包装 Fortran 库的 Python 创建一个小的 C 扩展，我基本上调用“init”来设置 FFTW 规划器，另一个函数来提供我的 2D 列表（数组）和一个“计算”函数。

创建 C 扩展是一项小任务，并且有很多针对该特定任务的优秀教程。

这种方法的好处是我们获得了速度……非常快的速度。唯一的缺点是在 C 扩展中，我们必须迭代 Python 列表，并将所有 Python 数据提取到内存缓冲区中。

回复收藏 0 原文

断爱 2024-11-22 18:55:29

FFTW 站点显示 fftpack 的运行速度约为 FFTW 的 1/3，但这是机械翻译的 Fortran 到 C 步骤，然后是 C 编译，我不知道 numpy/scipy 是否使用更直接的 Fortran 编译。如果性能对您来说至关重要，您可能会考虑将 FFTW 编译到 DLL/共享库中并使用 ctypes 来访问它，或者构建自定义 C 扩展。

回复收藏 0 原文