当前位置：文江博客话题详情

唱歌时连续语音识别？

发布于 2024-12-01 06:03:26 字数 330 浏览 1 评论 0原文

作为我的应用程序的一部分，我希望添加语音识别，但不是传统意义上的。我有一堆由某人演唱的歌词（分为诗句），其想法是找到当前正在演唱的诗句，以便可以将其显示在屏幕上。

我玩过 sphinx 并设置了一些基本示例并工作，但是虽然似乎有大量关于注册语音文本的文档，您可以在其中等待延迟然后处理结果，但我找不到太多关于连续识别句子的想法。当然，这是在我到达唱出歌词而不是说出歌词的部分之前！

有没有人有这方面的经验，如果有的话，有什么地方可以提供一个好的起点吗？或者我想通过狮身人面像实现的目标太过雄心勃勃，而且它永远不会真正正常工作吗？我愿意考虑其他库，但它们必须是免费的，而 sphinx 是我能找到的最受广泛关注的库。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

々眼睛长脚气 2024-12-08 06:03:26

只要稍有延迟，就完全有可能识别语音。此外，如果你或多或少了解你期望得到什么。这称为“部分结果”，可通过 API 在所有 CMUSphinx 解码器中使用。基本上你可以在过程中检索假设。

关于如何稳定这个结果（如何提取其中的稳定部分）有一个小问题需要考虑，但这种技术称为回溯并且可以很容易地实现

对于唱歌，考虑到可以过滤掉音乐，它也是可行的。

回复收藏 0 原文

~没有更多了~

关于作者

草莓味的萝莉

暂无简介

0 文章

0 评论

478 人气

关注发私信

友情链接

文江博客

唱歌时连续语音识别？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

唱歌时连续语音识别？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。