当前位置：文江博客话题详情

基频 + C# 中的语音检测

发布于 2024-08-08 06:10:17 字数 175 浏览 12 评论 0原文

我正在尝试通过麦克风实时检测语音输入。

我已准备好接收输入，执行 FFT 算法并得到以 dB 为单位的结果。我有频域、时域和频谱图。

如何获得基频？如果我得到基频，我可以指定如果频率在某些值之间，那么我们正在谈论的是语音吗？有没有其他方法可以用我已经拥有的东西来做到这一点？

提前致谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

屋檐 2024-08-15 06:10:17

频率估计有许多不同的算法，使用正确的算法取决于您的算法正在做。您期望什么样的输入？您想用该输入做什么？你有什么样的处理能力？

如果您想要做的话，检测基频并不能帮助您识别特定的人是否正在说话。你声音的频率不断变化。您必须对人的共振峰等进行“指纹”。

仅仅找到 FFT 的峰值并不会给您带来良好的语音结果。查看倒谱分析。

回复收藏 0 原文

帅气尐潴 2024-08-15 06:10:17

取声谱图上语音范围内的最高峰（例如，400 到 10K Hz）。这应该给你基频。

或者，您可能需要整合频率直方图。这是因为有时您的单词以齿擦音（“s”音）和摩擦音（“f”和“th”音）开头或包含它们，它们具有相当高的频率和宽频谱。您不想错过语音的开头，因为它不是以元音开头的。

另一个因素是除了声音之外你还会听到什么。背景噪音很大吗？什么样的？如果没有，那么只要有声音就足够了。例如，如果有音乐，那么你就会面临一个完全不同的挑战。如果您想区分语音和其他声音，那么我会尝试使用神经网络方法——它可能需要这种程度的复杂性。

回复收藏 0 原文

~没有更多了~

关于作者

带刺的爱情

暂无简介

文章

25 人气

关注发私信

知足的幸福

文章 0 评论 0

关注

我一向站在原地

文章 0 评论 0

关注

慕烟庭风

文章 0 评论 0

关注

秉忠贞之诚守退让之实

文章 0 评论 0

关注

小兔几

文章 0 评论 0

关注

mb_3y7WUgWY

文章 0 评论 0

友情链接

文江博客

基频 + C# 中的语音检测

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签