当前位置：文江博客话题详情

c++ speech-recognition audio-processing

获取 C++ 中捕获的音频信号的幅度（或有效值电压）；由 wavin lib 提供。？

发布于 2024-10-29 00:57:24 字数 302 浏览 6 评论 0原文

我正在研究一个非常基本的机器人项目，并希望在其中实现语音识别。我知道这是一件复杂的事情，但我希望只用 3 或 4 个命令（或单词）来完成它。

我知道使用 wavin 我可以录制音频。但我希望对音频信号进行实时幅度分析，该怎么做，波形将以 8 位、单声道输入。

我想过将信号分成一组特定时间，进一步将其分成更小的子集，获取子集的平均均方根值，然后将它们相加，然后看看它们与实际存储的信号有多少不同。错误低于所有（或大多数）集合的可接受值，然后打印该单词。

如何实施？如果您还可以向我提供任何其他建议，那就太好了。

提前致谢。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

一花一树开 2024-11-05 00:57:25

没有简单的方法来识别单词，因为它们基本上是一系列随时间和频率变化的音素。

经典的孤立词识别系统使用信号MFCC（倒谱系数）作为输入数据，并尝试使用 HMM（隐马尔可夫模型）或 DTW（动态时间规整）算法识别模式。

如果您不需要录音按钮，您还需要一个静音检测模块。

例如，爱丁堡大学工具包提供了其中一些工具（带有良好的文档）。

如果您不想“从头开始”构建它或没有灵感来源，这里是这样一个系统（使用自己的工具包）的（旧但免费）实现，带有关于其工作原理的完整解释和实际示例。

该系统是 LVCSR（大词汇连续语音识别），您只需要它的一个子集。如果有人知道一个开源的减少词汇量的系统（比如简单的 IVR），那将是受欢迎的。

如果您想自己制作一个基本系统，我建议您使用 MFCC 和 DTW：

对于要建模的每个目标单词：
- 记录该词的一些实例
- 通过单词计算一些（例如每10ms）delta-MFCC以获得模型
当你想要识别信号时：
- 计算该信号的一些 delta-MFCC
- 使用 DTW 将这些 delta-MFCC 与每个模型化单词的 delta-MFCC 进行比较
- 输出最适合的单词（使用阈值来丢弃垃圾）

回复收藏 0 原文

世态炎凉 2024-11-05 00:57:25

如果您只想识别一些命令，可以使用许多商业和免费产品。请参阅需要适用于 Linux 的文本转语音和语音识别工具< /a> 或有什么区别System.Speech.Recognition 和 Microsoft.Speech.Recognition？或 iPhone 上的语音识别。这些问题的答案与许多可用的产品和工具相关。语音识别和命令列表的理解是商业解决的一个非常常见的问题。您拨打的许多语音自动电话系统都使用这种类型的技术。开发人员可以使用相同的技术。

通过几个月来观察这些问题，我发现大多数开发人员的选择都是这样的：

Windows 人员 - 使用 .Net 或 Microsoft.Speech 的 System.Speech 功能并安装 Microsoft 提供的免费识别器。 Windows 7 包含完整的语音引擎。其他可免费下载。同一引擎有一个 C++ API，称为 SAPI。请参阅 http://msdn.microsoft.com/en-us/magazine/ cc163663.aspx。或 http://msdn.microsoft.com/ en-us/library/ms723627(v=vs.85).aspx
Linux 人员 - Sphinx 似乎有很多追随者。请参阅 http://cmusphinx.sourceforge.net/ 和 http://cmusphinx.sourceforge.net/wiki/
商业产品 - Nuance、Loquendo、AT&T 等
在线服务 - Nuance、Yapme 等

当然这也可能有帮助 - http://en.wikipedia.org/wiki/List_of_speech_recognition_software

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

书间行客

文章 0 评论 0

我ぃ本無心為│何有愛

文章 0 评论 0

神妖

文章 0 评论 0

undefined

文章 0 评论 0

38169838

文章 0 评论 0

彡翼

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文