用于嵌入式应用的语音识别引擎

发布于 2024-08-14 01:20:48 字数 124 浏览 12 评论 0原文

我正在尝试研究可用的语音识别引擎和 SDK，用于开发 Windows CE 语音应用程序。我遇到过 Nuance，但没有看到其他任何东西。如果可能的话，我更喜欢 .Net SDK，但我想大多数都是 C/C++。我很感激任何建议。谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

酷到爆炸 2024-08-21 01:20:48

Nuance 基本上已经买下了所有人。恐怕他们统治着语音市场……

还有一些其他公司从事这项技术，但我不知道他们在嵌入式市场做得如何。有 telisma 和 Loquendo，两者都有很强的非英语存在感（而且他们的英语也不错）。

然后还有IBM。他们有 ViaVoice 嵌入式。

业界正在等待的一件大事就是看看微软收购 TellMe 会产生什么结果，但是我认为他们可能会远离嵌入式市场，而不是将处理推向“云”，而这正是 TellMe 长期以来一直在的地方。

回复收藏 0 原文

旧城空念 2024-08-21 01:20:48

我使用 IVR 应用程序；除了 Nuance 之外，我们目前还在评估 Microsoft、IBM 和 Lumenvox。

大多数手机上包含的语音识别应用程序旨在将语音输入与先前所说的短语进行匹配，例如将短语“Joe”分配给地址簿条目，并在您说“Joe”时让手机拨打该地址簿条目。更强大的语音识别引擎尝试通过将短语分解为音素来破译自由形式的语音，并且然后与声学存储库进行匹配，尝试找出实际所说的内容。一个成熟的语音识别引擎需要相当大的 CPU 处理能力；要在移动设备上使用语音识别执行任何复杂的操作，您可能需要将数据从设备发送到服务器进行处理。

回复收藏 0 原文

睡美人的小仙女 2024-08-21 01:20:48

尝试查看 Microsoft 的语音 API，http://msdn.microsoft.com/en -us/library/ms897381.aspx

我相信它可以在 CE 设备上运行。

回复收藏 0 原文

z祗昰~ 2024-08-21 01:20:48

还有开源项目 CMU Sphinx 。他们有一个名为 PocketSphinx 的变体，专门针对便携式设备。

回复收藏 0 原文

玩心态 2024-08-21 01:20:48

正如我上面的评论之一所述，我们正在尝试 Vangard Voice Systems 的语音识别 .Net SDK。它使用 Nuance 的 Vocon3200 语音识别引擎，该引擎备受推崇，并且在早期测试中似乎运行良好。我们现在使用的是廉价麦克风，并且存在一些外部噪音问题。希望降噪耳机能够解决这个问题。该软件模型有点缺乏，因为它基本上与现有的非语音应用程序挂钩。由于这一事实，存在一些限制，并且开发人员可以访问的 API 也有限。每当您尝试过度简化类似的事情时，都会使制定强大的解决方案变得更加困难。话虽如此，我们确实找不到任何竞争产品可以满足我们对 .Net SDK 移动应用程序语音支持的需求。他们目前已经开辟了一个不错的小利基市场。

我更愿意使用 Nuance 的 C++ SDK（另一家公司为其编写了 .Net 包装器），但 Nuance 业务模型假设我们正在开发一款用于转售的产品，并且涉及一些重要的特许权使用费。对于想要开发内部应用程序的公司来说，这是一个真正的障碍。

回复收藏 0 原文

~没有更多了~