当前位置：文江博客话题详情

语音合成从哪里开始

发布于 2024-11-05 05:52:31 字数 193 浏览 3 评论 0原文

你们可能熟悉 Google 的 TTS 引擎：此处。

我对类似的东西如何分析输入并挑选出不同的音节/词性有基本的了解，但是如果我想为 TTS 系统创建“语音”，我应该从哪里开始呢？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

瑶笙 2024-11-12 05:52:31

我在大学里花了近一个学期的时间来学习这个问题的答案，并提前一年（或更长）的课程来学习理解该过程所需的底层信号处理。整个课程都致力于语音合成，整个课程致力于信号处理。

人们可以将人类的声道视为一个过滤器，将声门视为一个脉冲发生器，也就是说，语音实际上是经过声道、口腔和鼻腔过滤的脉冲序列的结果。

对于每个音素，“过滤器”都会不同，因此您将需要一个音素库来为其生成“过滤器”。理论上，逆滤波可用于音素声音剪辑库来查找“滤波器”系数。 Levinson-Durbin 递归通常用于查找 LPC 系数。

必须创建声门脉冲序列。一种简单的方法是将脉冲串与正半正弦波进行卷积。

最后，使用与您想要创建的音素相关的“过滤器”系数过滤声门脉冲序列。

但这仅适用于有声语音。为了生成清音语音，一个简单的解决方案是使用与清音音素相关联的“滤波器”系数来过滤随机噪声信号。

在其之上的一层抽象，创建所需的音素列表，然后连接。简单如馅饼！

更新：

一位朋友指出 Festival，一个用于输入文本和获取语音的“黑匣子”：http://festvox.org /节日/

回复收藏 0 原文

~没有更多了~

关于作者

南巷近海

暂无简介

0 文章

0 评论

25 人气

关注发私信

束缚ｍ

文章 0 评论 0

关注

alipaysp_VP2a8Q4rgx

文章 0 评论 0

关注

α

文章 0 评论 0

关注

一口甜

文章 0 评论 0

关注

厌味

文章 0 评论 0

关注

转身泪倾城

文章 0 评论 0

友情链接

文江博客

语音合成从哪里开始

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

束缚ｍ

alipaysp_VP2a8Q4rgx

α

一口甜

厌味

转身泪倾城

友情链接

语音合成从哪里开始

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

束缚ｍ

alipaysp_VP2a8Q4rgx

α

一口甜

厌味

转身泪倾城

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。