当前位置：文江博客话题详情

Audio window fft size

FFT 的窗口大小与数据长度

发布于 2024-10-30 07:26:18 字数 290 浏览 8 评论 0原文

我正在尝试对流音频数据进行快速频谱分析以捕获元音（类似于 JLip-sync）。使用 PyAudio 在短时间内（0.0625 秒）捕获小块 (1024) 的语音数据。使用 numpy.fft 进行分析，并使用 numpy.hanning 窗口消除泄漏。我使用 4096*4 作为采样率（不是 44100 或 22050，也可以讨论；4096*4 最接近 22050）。

考虑到我感兴趣的频率（范围从 300 Hz 到 3000Hz），如何使用我正在寻找的数据长度和最小/最大频率来计算理想的窗口大小？

谢谢。

卡迪尔

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

自由如风 2024-11-06 07:26:18

@Kadir：

在使用离散傅里叶变换（DFT或FFT）处理数据之前对数据进行加窗的目的是最大限度地减少频谱泄漏，当您尝试对非循环数据进行傅里叶变换时会发生这种情况。

窗口化的工作原理是在序列的开始和结束时强制数据平滑为零，但不是之前。缩短窗口会不必要地破坏信息。

因此，您的窗口长度应该与样本序列的长度相匹配。例如，对于 1024 个样本，您的窗口长度应为 1024。

如果您要解析的最高频率是 3 KHz，请在不同的采样率下使用 8192 个样本或更多样本，例如 16384 或 32768 个样本。

另外，尝试不同的FFT算法、不同的样本长度和不同的窗口，包括Hann（汉宁），还有其他旁瓣衰减更好的窗口，例如Blackman-Harris系列和Kaiser-Bessel系列等。

如果您的应用存在噪声，您可能必须在更好的噪声抑制窗口和更高的光谱分辨率窗口之间进行选择。因此，尝试不同的窗口是个好主意，这样您就可以找到最适合您的应用程序的窗口。

现在，写下每个设置的结果（即每个窗口、样本长度、采样率等），并寻找在多个设置中一致的结果。您将了解更多有关您的数据的信息，并且很可能找到问题的答案。

您可以使用 Matlab 执行此操作： http://www.mathworks.com/help/ techdoc/ref/fft.html

或者使用此在线 FFT 频谱分析仪：http://www.sooeet.com/math/fft.php

并且不要忘记在这里发布您的结果。

回复收藏 0 原文

抱着落日 2024-11-06 07:26:18

关键因素是频域中需要多少分辨率来区分不同的元音。

分辨率为 1 / T，其中 T 是 FFT 窗口的持续时间。

如果采样时间为 62.5 ms，那么如果 FFT 的大小与采样间隔（1024 个样本）相同，则最大分辨率为 16 Hz（即每个 FFT 箱的宽度为 16 Hz）。

如果您采用较小的 FFT，那么显然您的分辨率会相应变差。
例如，512 点 FFT 的分辨率仅为 32 Hz。

回复收藏 0 原文

~没有更多了~

关于作者

冬天旳寂寞

暂无简介

文章

评论

921 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

琉璃梦幻

文章 0 评论 0

qq_4zWU6L

文章 0 评论 0

话少情深

文章 0 评论 0

西西弗的石头怪

文章 0 评论 0

彻夜缠绵

文章 0 评论 0

千寻…

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文