当前位置：文江博客话题详情

如何使用傅里叶变换从 WAV 文件中提取半精确频率

发布于 2024-09-02 08:34:00 字数 155 浏览 22 评论 0原文

假设我有一个 WAV 文件。在此文件中，是一系列精确的 1 秒间隔的正弦音。我想使用 FFTW 库按顺序提取这些音调。这是不是特别难做到？我该怎么办呢？

另外，将这种音调写入 WAV 文件的最佳方法是什么？我假设我只需要一个简单的音频库来输出。

我选择的语言是 C

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

晚风撩人 2024-09-09 08:34:00

要获取文件某个部分的功率谱：

收集 N 个样本，其中 N是 2 的幂 - 例如，如果您的采样率为 44.1 kHz，并且您想要大约每秒采样一次，则假设 N = 32768 个样本。
对样本应用合适的窗口函数，例如Hanning
传递将样本窗口化到 FFT 例程 - 理想情况下，您想要一个实数到复数的 FFT，但如果您全部有一个复数到复数的 FFT，然后为所有虚数输入部分传递 0
计算您的 FFT 输出箱 (re * re + im * im)
（可选）计算每个幅值平方输出的 10 * log10 bin 获取幅度值，单位为 dB

现在您已经有了您需要的功率谱识别峰值，如果您有合理的信噪比，这应该非常简单。请注意，N 越大，频率分辨率越高。对于上述 44.1 kHz 采样率和 N = 32768 的示例，每个 bin 的频率分辨率为 44100 / 32768 = 1.35 Hz。

回复收藏 0 原文

赤濁 2024-09-09 08:34:00

您基本上对估计频谱感兴趣 - 假设您已经过了阅读阶段WAV 并将其转换为离散时间信号。

在各种方法中，最基本的是周期图，它相当于采用加窗离散傅里叶变换（使用 FFT）并保持其平方幅度。这与保罗的回答相对应。您需要一个跨越您想要检测的最低频率的多个周期的窗口。示例：如果您的正弦波可以低至 10 Hz（周期 = 100 毫秒），则您应该采用 200 毫秒或 300 毫秒左右（或更长）的窗口。然而，周期图有一些缺点，尽管它计算起来很简单，而且如果高的话就足够了不要求精度：

原始周期图不太好
由于光谱的光谱估计
偏差和方差这一事实
在给定频率下不减少
作为中使用的样本数量
计算量增加。

通过对多个窗口进行平均并明智地选择宽度，周期图可以表现得更好（Bartlet 方法）。还有许多其他方法可以估计频谱（AR 建模）。

实际上，您并不是对估计整个频谱感兴趣，而只是对单个频率的位置感兴趣。这可以通过寻找估计频谱的峰值（按照解释完成）来完成，但也可以通过更具体和强大（且复杂）方法（Pisarenko，MUSIC 算法）。对于你的情况来说，他们可能会太过分了。

回复收藏 0 原文

夜夜流光相皎洁 2024-09-09 08:34:00

WAV 文件包含线性脉冲编码调制 (LPCM) 数据。这仅仅意味着它是固定采样率的幅度值序列。文件开头包含 RIFF 标头，用于传达诸如采样率和每个样本的位数（例如 8 kHz 有符号 16 位）。

格式非常简单，您可以轻松地推出自己的格式。但是，有几个库可以加快该过程，例如 libsndfile。简单直接媒体层 (SDL)/SDL_mixer 和 PortAudio 是两个不错的播放库。

至于将数据输入 FFTW，您需要缓冲 1 秒的块（通过采样率和每个样本的位数确定大小）。然后将所有样本转换为 IEEE 浮点型（即 float 或 double，具体取决于 FFTW 配置 -libsndfile 可以为你做到这一点）。接下来创建另一个数组来保存频域输出。最后，通过将两个缓冲区传递到 fftw_plan_dft_r2c_1d 并调用 fftw_execute 以及返回的 fftw_plan 句柄。