使用 CMU Shinx、JSAPI 和 Google Speech API 进行语音识别

发布于 2024-12-23 09:53:33 字数 522 浏览 1 评论 0原文

语音识别是我当前项目的众多功能之一,很可能会在 J2EE 中开发(如果选择合理,也欢迎其他语言)。

大多数链接位于 googleSO 建议上述三个选项、Sphinx 4、直接 JSAPI 和 Google Speech API(对 google 进行服务器调用,然后以文本形式获取结果)。

我还有哪些其他免费选项?如果我使用 Sphinx-4,如何获得与它一起使用的通用英语的语言模型?

Speech recognition is one of the many features of my current project which will be most probably developed in J2EE (other languages are also welcomed if their choice is justified).

Most of the links at google and on SO suggest the above mentioned three options, Sphinx 4, JSAPI directly and Google Speech API (making a server call to google and than getting the result as text).

What are the other freely available options for me ? And If I use Sphinx-4 how do I get the language model for general English to be used with it ?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

何以笙箫默 2024-12-30 09:53:33

是的,有。

  1. 可以使用 Google 语音识别器的包装器(基本的一行代码)。您以 FLAC 或 SPEEX 格式发送语音音频并接收识别和置信度分数。唯一的问题是谷歌可以像谷歌翻译一样关闭API。
  2. 其他选项是使用 Sphinx(Sphinx4 或 Pocketsphinx)。
  3. 可以使用 HTK (http://htk.eng.cam.ac.uk/) 并使用 HVite(HTK 解码器)或其他类似 Julius (http://julius.sourceforge.jp/en/) 的工具。还有其他选项使用 HTK 来训练声学模型和/或语言和语法。

Voxforge 拥有 HTK 和 Sphinx 的声学和语言模型 (http://voxforge.org/)。

Yes, there are.

  1. It is possible to use a wrapper to Google Speech Recognizer that is basic a line of code. You send speech audio in FLAC or SPEEX format and receive recognition and a confidence score. The only problem is that Google can close API as did with Google translate.
  2. Other option is to use Sphinx (Sphinx4 or Pocketsphinx).
  3. It is possible to use HTK (http://htk.eng.cam.ac.uk/) and use HVite (HTK decoder) or other like Julius (http://julius.sourceforge.jp/en/). There are other options that use HTK to train acoustic models and/or language and grammar.

Voxforge has acoustic and language models for HTK and Sphinx (http://voxforge.org/).

把人绕傻吧 2024-12-30 09:53:33

如果我使用 Sphinx-4,我如何获得与其一起使用的通用英语的语言模型?

您可以从 CMUSphinx 网站和其他地方下载它们。您也可以自己构建它们。可能的位置之一是

http://www.keithv.com/software/csr/

And If I use Sphinx-4 how do I get the language model for general English to be used with it ?

You can download them from CMUSphinx website and from other places. You can also build them yourself. One of the possible locations are

http://www.keithv.com/software/csr/

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文