当前位置：文江博客话题详情

OS X 环境中的音频文件 FFT

发布于 2024-08-15 20:27:07 字数 154 浏览 1 评论 0原文

我希望在 OS X 上对线性 PCM 音频文件（可能具有多个音频通道）执行 FFT。解决此问题的最佳方法是什么？

多个消息来源表明 Apple 的 Accelerate Framework 正是我所需要的。如果是这样，我应该如何提取并正确准备浮点数据以供这些 FFT 函数使用？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

诺曦 2024-08-22 20:27:07

这大致就是您想要做的事情。填写您自己的输入和输出函数。

    // Stick new data into inData, a (float*) array
    fetchFreshData(inData); 

    // (You might want to window the signal here... )
    doSomeWindowing(inData);

    // Convert the data into a DSPSplitComplex 
    // Pardon the C++ here. Also, you should pre-allocate this, and NOT
    // make a fresh one each time you do an FFT. 
    mComplexData = new DSPSplitComplex;
    float *realpart = (float *)calloc(mNumFrequencies, sizeof(float));
    float *imagpart = (float *)calloc(mNumFrequencies, sizeof(float));
    mComplexData->realp = realpart;
    mComplexData->imagp = imagpart;

    vDSP_ctoz((DSPComplex *)inData, 2, mComplexData, 1, mNumFrequencies);

    // Calculate the FFT
    // ( I'm assuming here you've already called vDSP_create_fftsetup() )
    vDSP_fft_zrip(mFFTSetup, mComplexData, 1, log2f(mNumFrequencies), FFT_FORWARD);

    // Don't need that frequency
    mComplexData->imagp[0] = 0.0;

    // Scale the data
    float scale = (float) 1.0 / (2 * (float)mSignalLength);
    vDSP_vsmul(mComplexData->realp, 1, &scale, mComplexData->realp, 1, mNumFrequencies);
    vDSP_vsmul(mComplexData->imagp, 1, &scale, mComplexData->imagp, 1, mNumFrequencies);

    // Convert the complex data into something usable
    // spectrumData is also a (float*) of size mNumFrequencies
    vDSP_zvabs(mComplexData, 1, spectrumData, 1, mNumFrequencies);

    // All done!
    doSomethingWithYourSpectrumData(spectrumData);

希望有帮助。

Here's roughly what you want to do. Fill in your own input and output functions.

    // Stick new data into inData, a (float*) array
    fetchFreshData(inData); 

    // (You might want to window the signal here... )
    doSomeWindowing(inData);

    // Convert the data into a DSPSplitComplex 
    // Pardon the C++ here. Also, you should pre-allocate this, and NOT
    // make a fresh one each time you do an FFT. 
    mComplexData = new DSPSplitComplex;
    float *realpart = (float *)calloc(mNumFrequencies, sizeof(float));
    float *imagpart = (float *)calloc(mNumFrequencies, sizeof(float));
    mComplexData->realp = realpart;
    mComplexData->imagp = imagpart;

    vDSP_ctoz((DSPComplex *)inData, 2, mComplexData, 1, mNumFrequencies);

    // Calculate the FFT
    // ( I'm assuming here you've already called vDSP_create_fftsetup() )
    vDSP_fft_zrip(mFFTSetup, mComplexData, 1, log2f(mNumFrequencies), FFT_FORWARD);

    // Don't need that frequency
    mComplexData->imagp[0] = 0.0;

    // Scale the data
    float scale = (float) 1.0 / (2 * (float)mSignalLength);
    vDSP_vsmul(mComplexData->realp, 1, &scale, mComplexData->realp, 1, mNumFrequencies);
    vDSP_vsmul(mComplexData->imagp, 1, &scale, mComplexData->imagp, 1, mNumFrequencies);

    // Convert the complex data into something usable
    // spectrumData is also a (float*) of size mNumFrequencies
    vDSP_zvabs(mComplexData, 1, spectrumData, 1, mNumFrequencies);

    // All done!
    doSomethingWithYourSpectrumData(spectrumData);

Hope that helps.

回复收藏 0 原文

绮筵 2024-08-22 20:27:07

对音频数据进行 FFT 时，样本应进入实部，虚部应为零。

大多数 FFT 库（包括 Apple 的 vDSP）都包含一种称为“真实 FFT”的方法，其中输入是真实的（没有虚数分量）并且输出是复数。

回复收藏 0 原文

ゞ记忆︶ㄣ 2024-08-22 20:27:07

在我看来，您应该研究 Core Audio...我对它不是很熟悉，但看起来它应该已经为您提供了通道解交错，并且它直接与 PCM 数据一起工作。由于我不太熟悉，对此持保留态度，但我会尝试将 FFT 放入音频单元中，将单个通道的 PCM 数据作为输入，将 FFT 的结果存储在可访问的地方，然后传递输入一直到输出。

就实际执行 FFT 而言，对我来说，主要挑战似乎是将 PCM 输入强制为 FFT 例程想要操作的双 * 向量。查看 vDSP.h （加速框架的一部分），我看到像 vDSP_vflt16D （将 16 位整数向量转换为双精度实数向量）这样的函数，它看起来可以解决你的问题。

核心音频简介

回复收藏 0 原文

~没有更多了~