当前位置：文江博客话题详情

语音识别API

发布于 2024-10-01 03:38:49 字数 299 浏览 8 评论 0原文

我需要自动转录一些短 MP3，作为我正在进行的概念验证的一部分。我目前正在研究云解决方案或 Web API 服务，以将 MP3 作为简单的 HTTP 请求发送并接收回转录。

我在此处找到了唯一的免费/开源解决方案，但演示似乎不起作用（至少不在我需要转录的文件上）。我已经找到了一些呼叫中心的企业解决方案，但到目前为止，我还没有可以简单地将其集成到项目中。

有可用的基于网络的语音识别服务吗？能够过滤掉小噪音的将是一个优势。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

你怎么这么可爱啊 2024-10-08 03:38:49

以下是访问 Google ASR 功能的非官方方法。我昨天刚刚进行了测试，它仍然有效 - 您可以从以 16KHz 采样的 FLC 音频中获取包含单词和相关置信度分数的 JSON 样式 ASR 输出。

回复收藏 0 原文

还如梦归 2024-10-08 03:38:49

您也可以尝试使用Windows 7的语音识别引擎来生成字幕。这里就是用于此目的的工具。

回复收藏 0 原文

乖乖 2024-10-08 03:38:49

这可能是一个不错的匹配。此外，他们的 techcrunch 简介（查看此）列出的竞争对手为：SimulScribe、SpinVox、Vlingo、Nuance 、微软、谷歌
其中一些链接可能会有所帮助。

Vlingo、Bing 和 Google 在云端都有识别器，但我不认为他们会让它们公开编程。我相信只有经过授权的客户才能访问它们。

对于概念验证（和小批量），您是否考虑过仅使用 Windows 7 中的桌面语音引擎？ System.Speech 之间有什么区别.Recognition 和 Microsoft.Speech.Recognition？可能会有所帮助。 MS 桌面识别器附带听写语法，听起来这就是您所需要的。

回复收藏 0 原文

~没有更多了~

关于作者

澉约

暂无简介

0 文章

0 评论

25 人气

关注发私信

亚希

文章 0 评论 0

关注

cyp

文章 0 评论 0

关注

北漠

文章 0 评论 0

关注

11223456

文章 0 评论 0

关注

坠似风落

文章 0 评论 0

关注

游魂

文章 0 评论 0

友情链接

文江博客

语音识别API

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

亚希

cyp

北漠

11223456

坠似风落

游魂

友情链接

语音识别API

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

亚希

cyp

北漠

11223456

坠似风落

游魂

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。