哪些库可用于分析音频文件中的口头关键字和/或语音转文本?
我在业余时间是一个超级英雄,我正在尝试构建一个应用程序来分析音频中的口头关键字。 (想想紧急/911 电话)如果关键字是“抢劫”,并且在音频中说出该词,那么我想标记该文件并可能将其翻译为文本。
有哪些开发库或软件应用程序可以用于执行此类操作? C++ 或 Java 库是首选,但不是必需的。
I'm a super-hero in my off-time and I'm trying to build an application that analyzes audio for spoken keywords. (Think emergency/911 calls) If a keyword is "robbery", and that word is spoken within the audio provided I would like to flag that file and possibly translate it to text.
What development libraries or software applications are out there for doing this sort of thing? C++ or Java libraries are preferred but not required.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
Wiki 页面此处是一个很好的起点。在其中提到的那些中,我认为 CMU Sphinx 是最活跃的。
Wiki page here is a good starting point. Of the ones mentioned there I think CMU Sphinx is the most active one.
您可以与 Praat http://www.fon.hum.uva.nl/praat/< /a> ,它是一个出色的语音处理程序,并且有自己的脚本语言。你还可以在 Praat 社区找到很多脚本。您还可以使用 sendpraat http://www.fon.hum.uva.nl/ praat/sendpraat.html 将 praat 函数作为子例程使用。
You could work with Praat http://www.fon.hum.uva.nl/praat/ , it's an excelent program for working with phonetics and it has it's own scripting language. You can also find a lot of scripts in the Praat community. You can also use sendpraat http://www.fon.hum.uva.nl/praat/sendpraat.html to work with the praat functions as a subroutine.