当前位置：文江博客话题详情

关于 FFT 和音调估计的几个问题

发布于 2024-10-18 16:09:41 字数 364 浏览 8 评论 0原文

我需要对 FFT 和音调估计进行一些一般性的澄清。

1.) 我读到，FFT 的块大小越大，其精度就越高，尽管我知道这也有一个缺点。这是真的吗？因为我一直在试验，每当我使用 16384 的块大小而不是 8192 或 4096 时，我都会得到更糟糕的结果。有人可以向我解释一下吗？

2.) 最初，我认为从 FFT 获取音调只是获取最高强度的 bin 的简单问题。然而，在在这里发布并阅读了一些问题之后，我认为可能还有更多这样的问题。有人可以建议我如何从 FFT 中获得良好的音高估计吗？

3.）虽然我已经有了一个好主意，但有人可以简单地解释一下自相关器算法的作用吗？（我的想法是，它基本上是一种比较和对比算法，并且选择差异最小的算法）

非常感谢！

需要登录才能够评论，你可以免费注册一个本站的账号。

夜司空 2024-10-25 16:09:41

缺点是处理时间、内存消耗和延迟。如果您想要实时显示，则在开始处理之前必须等待整个帧填满，这可能会花费令人无法接受的时间。
是的，还有更多。具体来说，阶段。它也可能是具有最大负值（180 度偏移）的容器，或为零（90 度偏移）的容器，或两者之间的任何值。您可能想使用复数进行转换，并寻找最大的绝对值。
该算法通过测试信号与其自身的时移版本的“相似度”来寻找信号中的周期性元素。输出是从时间偏移到“相似性”的映射；然后您可以寻找最高值。

~没有更多了~