使用 CMU Shinx、JSAPI 和 Google Speech API 进行语音识别
语音识别是我当前项目的众多功能之一,很可能会在 J2EE 中开发(如果选择合理,也欢迎其他语言)。
大多数链接位于 google 和 SO 建议上述三个选项、Sphinx 4、直接 JSAPI 和 Google Speech API(对 google 进行服务器调用,然后以文本形式获取结果)。
我还有哪些其他免费选项?如果我使用 Sphinx-4,如何获得与它一起使用的通用英语的语言模型?
Speech recognition is one of the many features of my current project which will be most probably developed in J2EE (other languages are also welcomed if their choice is justified).
Most of the links at google and on SO suggest the above mentioned three options, Sphinx 4, JSAPI directly and Google Speech API (making a server call to google and than getting the result as text).
What are the other freely available options for me ? And If I use Sphinx-4 how do I get the language model for general English to be used with it ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
是的,有。
Voxforge 拥有 HTK 和 Sphinx 的声学和语言模型 (http://voxforge.org/)。
Yes, there are.
Voxforge has acoustic and language models for HTK and Sphinx (http://voxforge.org/).
您可以从 CMUSphinx 网站和其他地方下载它们。您也可以自己构建它们。可能的位置之一是
http://www.keithv.com/software/csr/
You can download them from CMUSphinx website and from other places. You can also build them yourself. One of the possible locations are
http://www.keithv.com/software/csr/