当前位置：文江博客话题详情

如何用C++实现语音识别和文本转语音？

发布于 2024-08-15 13:00:13 字数 87 浏览 6 评论 0原文

我想了解进行语音识别和文本到语音转换的各种技术。另请让我了解有关其的任何资源，例如链接、教程、电子书等。

哪种技术是实现这一目标最有效的技术？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

や莫失莫忘 2024-08-22 13:00:13

我将回答有关语音识别的部分（因为我对文本转语音不太了解）：

http://ecx.images-amazon.com/images/I/4190SZC61CL._BO2,204,203,200_PIsitb-sticker-arrow-click,TopRight,35,-76_AA240_SH20_OU01_.jpg

这本书，《语音识别的统计方法》是解释统计语音识别的数学基础的经典著作，由该领域的创始人 Frederick Jelinek 撰写。

您必须了解的最重要的概念是隐马尔可夫模型。几十年来，人们一直在语音识别中使用它们。最近的方法使用条件随机字段，请参阅论文 (PDF) 和相关软件工具包围巾。

编写自己的语音识别器相当困难。这是一个活跃的研究领域，举办了多个科学会议，例如 ASRU、Interspeech，ICASSP。

回复收藏 0 原文

无需解释 2024-08-22 13:00:13

两者都是非常广阔的领域。
关于识别：在此此架构中，您将了解如何构建基本的自动语音识别系统。它无论如何都还没有接近艺术的起点，但它是可以实现的，并且它有效。如果您想做更高级的事情，请阅读倒谱系数和隐马尔可夫模型。查看HTK，它是一个广泛使用的隐马尔可夫模型工具包。

关于文本到语音：我会看看Festival。

回复收藏 0 原文

凉月流沐 2024-08-22 13:00:13

有多个狮身人面像。主要活跃的是pocketsphinx和sphinx4。

Sphinx4 是用 Java 编写的。它更适合桌面和 Web 应用程序。

Pocketsphinx是用C编写的。对于嵌入式设备来说更好。有 iphone/android 应用程序使用它。

听起来你想要口袋狮身人面像。尝试一下这个教程：
http://www.speech.cs.cmu.edu/sphinx/tutorial。 html

询问 pocketsphinx/sphinx4 问题的更好地方是 CMU 的 sourceforge 论坛。

您还应该提供更多信息，例如您打算制作的内容。

至于书籍，语音识别的圣经是《口语处理》

回复收藏 0 原文

冰火雁神 2024-08-22 13:00:13

既然您提到了 MS -

您应该只查看 Microsoft Speech 网站。它包含许多用于处理语音的资源，包括 TTS 和语音识别。

回复收藏 0 原文

够运 2024-08-22 13:00:13

如果您正在寻找一些实际代码，请查看 Sphinx，这是一个来自 CMU 的开源语音识别项目。它不是用 C++ 编写的，但如果您对算法感兴趣，它实现了很多您可以学习的东西。（我也想回应 @dehmann 的观点：阅读隐马尔可夫模型。）

回复收藏 0 原文

誰認得朕 2024-08-22 13:00:13

如果您对如何使用您的奇特语音识别感到好奇，您应该阅读：
兰迪·艾伦·哈里斯 (Randy Allen Harris) 的语音交互设计

它提供了一些关于何时使用语音以及如何在应用程序中使用它的很好的建议。

回复收藏 0 原文

~没有更多了~

关于作者

薯片软お妹

暂无简介

0 文章

0 评论

25 人气

关注发私信

友情链接

文江博客

如何用C++实现语音识别和文本转语音？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（6）

关于作者

相关话题

热门标签

推荐作者

lixs

敷衍

盗梦空间

tian

13375331123

你对谁都笑

友情链接

如何用C++实现语音识别和文本转语音？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（6）

关于作者

相关话题

热门标签

推荐作者

lixs

敷衍

盗梦空间

tian

13375331123

你对谁都笑

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

敷衍