如何在 Android 中检测音频中的语音成分?

发布于 2024-12-21 20:12:24 字数 121 浏览 1 评论 0原文

实时检测音频流的语音部分的简单方法是什么:?我已经阅读过有关使用 MFCC、FFT 等的内容。但我找不到任何关于如何完成的明确解释。

另外,是否有任何 PC 程序可以分析 wav 文件并检测其中是否存在人类语音?

What would be an easy way to detect the speech portions of an audiostream in realtime:? I have sread about using MFCC's , FFTs and so on. But I couldnt find any clear explanation of how itis to be done.

Additionally, is there any PC program which can analyze wav files and detect the presence of human speech present in it?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

够运 2024-12-28 20:12:24

这个话题太复杂了……;没有简单的解决方案或明确的解释;有许多现有的技术和算法。现代技术涉及人工智能和机器学习算法,而不仅仅是 FFT 或倒谱分析等琐碎的 DSP 算法。不过,你可以尝试Sphinx-4,它是用Java编写的,因此它天然是跨平台的。

http://cmusphinx.sourceforge.net/sphinx4/

我没有尝试过,所以我没有可以谈论它的可用性,但请确保最好的算法已获得专利并且非常非常昂贵......

This topic is so much complex...; there are no simple solutions or clear explanations; there are many existing techniques and algorithms. Modern techniques involve artificial intelligence and machine learning algorithms, not only trivial DSP algorithms like FFT or cepstral analysis. However, you can try Sphinx-4 which is written in Java so that it is naturally cross-platform.

http://cmusphinx.sourceforge.net/sphinx4/

I haven't tried that so I am not able to say anything about its usability, but be sure that the best algorithms are patented and really, really expensive...

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文