当前位置：文江博客话题详情

FFT 算法：什么输入/输出？（回复：实时音高检测）

发布于 2024-09-30 05:57:26 字数 777 浏览 6 评论 0原文

我正在尝试从音频流中提取音高数据。据我所知，FFT 似乎是最好使用的算法。

有人可以帮助我理解这个 FFT 算法的作用，而不是直接深入数学吗？

请不要说“FFT 从原始信号中提取频率数据”之类的明显内容。我需要更详细的信息。

我传入什么，传出什么？

一旦我清楚地理解了接口，这将有助于我理解实现。

我认为我需要传入一个音频缓冲区，我需要告诉它每次计算要使用多少字节（比如该缓冲区中的最新 1024 字节）。也许我需要指定我希望它检测的音高范围。现在它要回传什么？频率仓数组？这些是什么？

（编辑：）我找到了一个可以使用的 C++ 算法（如果我只能理解它的话）

Performous 从麦克风中提取音调。而且代码是开源的。以下是该算法的编码人员对该算法功能的描述。

PCM 输入（带缓冲）
FFT（一次 1024 个样本，之后从缓冲区前面删除 200 个样本）
重新分配方法（相对于之前的 FFT 为 200 个样本）
峰值过滤（这部分可以做得更好，甚至可以做得更好）省略）
将峰值组合成谐波组（我们将组合称为音调）
音调的时间过滤（更新之前检测到的音调集，而不是简单地使用新检测到的音调）
选择最佳的声音音调（频率限制，权重，可以也使用谐波阵列，但我不认为我们这样做）

但是有人可以帮助我理解它是如何工作的吗？从 FFT 发送到重新分配方法的是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

臻嫒无言 2024-10-07 05:57:27

FFT 只是该过程中的一个组成部分，它可能不是音调检测的最佳方法。阅读音高检测并决定您要首先使用哪种算法（这取决于您到底想要测量什么音高 - 语音、单一乐器、其他类型的声音等。在进入低音之前先做好这一点级别细节，例如 FFT（一些但不是所有音高检测算法在内部使用 FFT）

已经有许多类似的问题，例如使用 FFT 进行实时音高检测和使用 FFT 进行小号的音调检测，维基百科上有很好的概述材料 a> 等 - 阅读这些内容，然后决定是否仍要推出自己的基于 FFT 的解决方案，或者使用适合您的特定应用程序的现有库。

回复收藏 0 原文

无人问我粥可暖 2024-10-07 05:57:27

这里有一个选择的因素。最简单的实现方法是输入 (2^n 个样本) 复数，然后输出 2^n 个复数，所以也许您应该从这里开始。

在 DCT（离散余弦变换）的特殊情况下，通常输入的是 2^n 个样本（通常是浮点数），输出的是 2^n 个值，通常也是浮点数。 DCT 是一种 FFT，但仅采用实数值，并根据余弦分析函数。

定义一个结构来处理复杂值是明智的（但通常会被跳过）。传统上，FFT 是就地完成的，但如果不这样做，它也能正常工作。

实例化一个包含 FFT 工作缓冲区的类（如果您不想就地进行 FFT）并将其重新用于多个 FFT 可能很有用。

回复收藏 0 原文

苦行僧 2024-10-07 05:57:27

输入 N 个 PCM 样本（纯实复数）。结果是频域的 N 个 bin（每个 bin 对应于采样率的 1/N 切片）。每个 bin 都是一个复数。这些值通常应以极坐标格式（绝对值和参数）处理，而不是实部和虚部。绝对值表示箱中心频率附近的声音量，而参数表示相位（正弦波在哪个位置传播）。

大多数情况下，编码器仅使用幅度（绝对值）并丢弃相位角（参数）。

回复收藏 0 原文

~没有更多了~

关于作者

热血少△年

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

FFT 算法：什么输入/输出？（回复：实时音高检测）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

忆悲凉

hgfg1645

qq_qLPLYi

戏舞

殊姿

﹂绝世的画

友情链接

FFT 算法：什么输入/输出？ （回复：实时音高检测）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

忆悲凉

hgfg1645

qq_qLPLYi

戏舞

殊姿

﹂绝世的画

友情链接

FFT 算法：什么输入/输出？（回复：实时音高检测）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。