当前位置：文江博客话题详情

依赖于说话者的语音识别引擎与 sdk

发布于 2024-08-18 11:10:39 字数 85 浏览 3 评论 0原文

我想做一个小应用程序，有谁知道一个好的依赖于说话者的语音识别引擎和 SDK。（不是语音到文本引擎）

谢谢你，

Efrat

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

傲性难收 2024-08-25 11:10:39

Sphinx 可能符合您正在寻找的内容。它是一个开源语音识别平台，也是卡内基梅隆大学正在进行的一个项目。

回复收藏 0 原文

甜妞爱困 2024-08-25 11:10:39

我使用 sphinx-4 得到了 82.25% 的准确率。我正在研究如何将其提高到 95% 以上。我只转录一个人的声音，因此如果依赖于说话者的系统会有所帮助，那就太好了。词汇量约为40,000个单词。我有一个双核系统，我可以轻松运行 sphinx-train 和 sphinx4 解码器，尽管训练器需要一天的时间来训练我拥有的 40 小时的音频，并且解码器是实时的。

我想知道是否有一个产品/开源库可以用来提高我的准确率。

谢谢，
陀罗尼

回复收藏 0 原文