使用 Sphinx 4 进行 mp3 识别

发布于 2024-12-29 19:14:13 字数 137 浏览 5 评论 0原文

我们可以使用 mp3 文件进行语音识别过程而不使用 wav 文件吗？或者我们可以从 mp3 生成 wav 文件，然后进行语音识别而不会对准确性产生严重影响吗？问题是我需要最大限度地减少应用程序中通过网络传输的负载。转换中丢失的信息会成为影响准确性的重要因素吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

高速公鹿 2025-01-05 19:14:13

我们可以使用 mp3 文件进行语音识别过程而不使用
wav 文件？

不直接。为了能够识别mp3流，您需要使用java库读取mp3并转换为pcm流（tritonus -mp3，lameonj）。您还可以调用 ffmpeg 作为单独的进程进行解码。

或者我们可以从 mp3 生成 wav 文件，然后进行语音识别而不会对准确性产生严重影响吗？

无论您在何处解码 mp3 文件，这两种情况的准确性都会受到影响。

问题是我需要最小化通过
我的应用程序中的网络。信息会丢失吗
转化率是影响准确性的一个重要因素吗？

最好使用无损编解码器（如 flac）进行传输。 mp3 转换会降低 ASR 准确性。另一种方法是在客户端计算特征并将其传输到服务器。

回复收藏 0 原文

~没有更多了~

关于作者

篱下浅笙歌

暂无简介

文章

27 人气

关注发私信

夢野间

文章 0 评论 0

关注

百度③文鱼

文章 0 评论 0

关注

小草泠泠

文章 0 评论 0

关注

zhuwenyan

文章 0 评论 0

关注

weirdo

文章 0 评论 0

关注

坚持沉默

文章 0 评论 0

友情链接

文江博客

使用 Sphinx 4 进行 mp3 识别

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者