Sphinx II 识别读取和识别

发布于 2024-08-04 03:11:22 字数 393 浏览 5 评论 0原文

我正在尝试使用 Sphinx II 实现语音识别器客户端，我的目标是让某人阅读文本中的书面句子，并对每个单词进行置信度评分。为此，我使用有限状态语法和有限字典。
我得到了一些工作，但置信度分数非常低（< 0.30）。我使用与 Sphinx 2 的简单 Reco 示例相同的设置。由于每个发音的单词只有一种可能性（每个单词都是语法中的一种状态），因此我通常应该获得高分和时间高效的识别，但假设需要时间来计算。而且这个词一发音我就得到了假设。所以现在我实际上不知道该去哪里改进。我是否使用正确的解决方案来解决此类问题？我应该使用语言模型吗？如果是，如何将上下文限制为故事中的给定句子？

我还需要使用狮身人面像训练器吗？到目前为止，我已经使用网络工具生成了语言模型/字典。

我们将非常感谢您的帮助。谢谢，鲍里斯·古根

原文

分享到QQ

分享到微博