在android语音识别中,如何增加考虑输入完成的时间?
在android语音识别中,任何人都可以知道如何增加我们停止听到语音后考虑输入可能完成所需的时间。我需要防止端点在语音识别时在非常短的语音中间停顿…
在 Linux 下我可以使用哪些库(C 或 Python)来编写识别语音命令的软件?
我需要一份软件合同,要求从非常有限的集合中识别口头命令,例如“向上”、“向下”、“关闭”、“打开”等。 我似乎不需要完整的语音识别,即我不必…
Windows7 上语音识别 C# WPF 应用程序的两个问题
我制作了一个应用程序,它使用 SpeechRecognizer 类来设置简单的语法并识别简单的单词。 当我在 Win7 上运行它时,我注意到两件事。 1)我第一次启动…
为什么我的 Microsoft 语音识别结果的置信度始终等于 -1?
我正在使用 Microsoft Speech SDK 来实现一个使用语音识别的软件。 我向识别引擎提供了非常正常的语法,但是当启动引擎并说出正确的内容时,它会识别…
Android SpeechToText STT 对话框
有什么方法可以隐藏在android中使用语音转文本时显示的对话框吗?我在某处读到这是不可能的,但肯定有一种方法至少可以显示它然后立即隐藏它? 也许有…
当我重复项目时,如何在 grxml 文件中使用语义标记?
我正在为一个软件构建 GRXML 语法,该软件将使用 Microsoft 的语音 SDK 进行语音识别。 标签必须遵循标签格式“properties-ms/1.0”,我没有找到任何…
用于检测人的声音、性别、年龄和情绪的音频分析——之前有做过开源工作吗?
之前是否有在“音频分析”领域完成的开源工作来检测人声(例如,尽管有一些背景噪音),确定说话者的性别,可能确定没有。说话者的数量、说话者的年龄…