通过限制频率范围来提高 FFT 输出的频率分辨率？

发布于 2024-09-30 00:55:37 字数 462 浏览 11 评论 0原文

我对 FFT 和信号处理很陌生，所以希望这个问题有意义和/或不愚蠢。

我想对现场音频信号进行频谱分析。我的目标是在响应能力和频率分辨率之间找到一个良好的权衡，这样我就可以近乎实时地猜测传入音频的音调。

根据我收集的傅立叶变换背后的数学知识，样本大小和频率分辨率之间存在固有的平衡。样本越大，分辨率越好。由于我试图最小化样本大小（以达到近乎实时的要求），这意味着我的分辨率会受到影响（输出缓冲区中的每个槽对应于很宽的频率范围，这是不希望的）。

然而，对于我的预期应用，我并不关心大部分频谱。我只需要窄频率范围的频谱信息，例如 100hz - 1600hz。有没有办法修改 FFT 实现，以便我可以提高频域输出的分辨率，同时保持输入缓冲区大小恒定（且较小）？换句话说，我可以用输出总带宽换取输出分辨率吗？如果是这样，这是如何完成的？

尽管我对数学的掌握很弱，但似乎用零填充输入缓冲区可能很有趣，不是吗？

预先感谢您可以提供的任何帮助。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

撧情箌佬 2024-10-07 00:55:37

您无法从任何地方获取额外的信息，但您可以通过重叠连续的 FFT 来减少延迟。对于实时功率谱估计，通常将连续输入窗口重叠 50%。

在样本之间插入零是另一个有用的技巧 - 它可以在输出箱中为您提供更明显的分辨率，但实际上您所做的只是插值，即没有获得额外的信息（当然）。除了上面的重叠建议之外，您可能会发现这种技术很有用。

回复收藏 0 原文

颜漓半夏 2024-10-07 00:55:37

正如马克所说，添加零会引入谐波（不需要的频率）。

另外，当您说“更大的样本”时，您是指更多的样本还是更高的频率采样率？较高的频率采样率将导致每单位时间有更多的样本，但似乎您的意思是在固定采样率下有更多的样本（即分析更大的时间块）。

您提到的上限频率为 1600Hz，因此您需要至少 3200Hz 的采样率，即。双倍的。

至于一次处理的时间：您需要权衡响应能力（10 秒的缓冲区需要 10 秒+处理时间才能得到结果）与减少噪音。较小的缓冲器更有可能拾取寄生噪声信号。

顺便说一句，一开始在频域中思考可能具有挑战性。我发现对此最好的不是我在大学参加的各种应用数学课程，而是晶体学课程。晶体衍射图仅仅是二维傅里叶变换。事实证明，在我的第一份工作中处理地震数据的 FFT 时，了解衍射图样在视觉上与晶体结构的关系非常有用。

回复收藏 0 原文

水水月牙 2024-10-07 00:55:37

我不认为有什么“技巧”可以超越 FFT。 “添加零”也可能意味着对信号进行过采样。为了消除谐波，必须对信号进行滤波（这肯定会引入额外的噪声）。然后您将进行更长的 FFT，但之后整体分辨率仍然相同。

此外，您的加窗函数将拓宽结果中的频率峰值。

OTOH，如果频率落在两个 FFT bin 之间，则可以通过查看相邻 bin 的比率来获得更好的分辨率：
http://www.tedknowlton.com/resume/FFT_Bin_Interp.html

但这并不适用于更复杂的信号（具有许多同时频率）。

如果您想知道是否存在某些频率，我会研究过滤器和相关性。
如果你想确定某个频率，你可以先将其过滤掉，然后检测过零。设计滤波器时有很多参数，因此滤波器长度只是导致特定滤波器（阶跃）响应时间的一个参数。您可以对多个频率执行此操作，一个接一个...

添加：一些直觉：

因为 FFT 足以重建，所以原则上有无限多个更高分辨率的频谱导致相同的样本向量，没有一个更正确。 bin 插值本质上是计算另一种（“更好的拟合”）表示，而不是快速-傅里叶变换的均匀间隔的 bin。
在离散、量化的情况下，例如 8 位，请考虑两个非常接近的频率。如果差异足够小，它们将产生相同样本，例如 256 个样本。但是查看更多样本（也许 1024），您会发现差异变得足够大，足以可见。

PS：过采样的过滤也可以在 FFT 之后通过简单地忽略较高的 bin 来完成。

回复收藏 0 原文

病毒体 2024-10-07 00:55:37

您可以以 1600 Hz（或稍高一些，例如 2k）对数据进行低通滤波，然后重新采样到较低的采样率（滤波器频率的两倍，例如 4k）以减少样本数量。然后使用零填充来提高频率分辨率。

回复收藏 0 原文

￡冰雨忧蓝° 2024-10-07 00:55:37

你所说的目标与你的问题不相容。音频的音调与解析的频率峰值不同。请阅读有关声音和音乐音高估计的大量文献（这适用于具有感知音高的许多其他类型的声音）。自适应/增量/滑动时域技术可以为您提供比基于频域块的技术更低的延迟。

音频样本向量的零填充几乎与频域数据的插值相同。如果噪音或附近干扰很少，您可能会找到更准确（更高“分辨率”）的频率峰值位置。但您不会更好地抑制附近的光谱峰值（分离分辨率）或噪声。

在 FFT 之前对数据进行加窗（von Hann 等）可能有助于消除由附近但非 bin 或 2-bin 相邻频率引起的一些噪声。

补充：除非您的后采样低通滤波器近乎完美且相位线性，否则您实际上可能会在所需频带边缘附近失去频率分辨率。过滤不会将任何实际信息添加到感兴趣的频带中，因此对提高“分辨率”没有帮助。加窗更有可能减少来自其他频率的干扰。

回复收藏 0 原文

千紇 2024-10-07 00:55:37

您可能想了解一下压缩感知。您可以对本质上是预压缩信号的信号进行采样（并存储），以便稍后重建。只要信号稀疏度很高（您的情况可能就是这种情况），香农-奈奎斯特约束就可以稍微弯曲。缺点是重新创建原始信号的后处理可能需要大量计算时间。此外，您可能必须开发自己的设备驱动程序来管理您用来采样信号的任何硬件，因为工厂驱动程序可能假设您有兴趣遵守奈奎斯特-香农约束。更多信息可以在此处找到。

回复收藏 0 原文

~没有更多了~