当前位置：文江博客话题详情

创建 TTS 包

发布于 2024-09-07 18:51:04 字数 1436 浏览 3 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

放低过去 2024-09-14 18:51:04

为文本转语音引擎创建新的声音是一个复杂的过程。这不仅仅是让配音艺术家录制音频并简单地从中创建声音的问题。这方面需要做很多工作（将音频分割为音素；构建语音数据；构建词典；正确设置韵律和音频连接/合成规则）。

对于像 Microsoft 文本转语音引擎这样的语音引擎，您还面临着语音格式是专有的问题，因此您无法以该格式创建新的语音。您还受到引擎功能的限制。

目前您最好的选择是：

切换到使用 eSpeak 文本转语音引擎并使用 espeakedit 创建您自己的声音（联系开发人员寻求帮助）——该引擎使用一种合成方法，使其听起来相似微软的和史蒂芬·霍金用的语音，但是很清晰，发音总体很好；
使用不同的文本转语音引擎，例如使用语音录音的 Cepstral（这些引擎听起来更像人类，但我发现韵律不是很好，破坏了生成的音频）；
使用 Cepstral 的服务来创建特定于您需求的语音（这可能很昂贵）。

我正在考虑使用 librivox.org 中的音频数据来生成文本到语音的声音。不过，这可能还需要 3 到 4 年的时间，我才能真正发挥作用。

回复收藏 0 原文

~没有更多了~

关于作者

慵挽

暂无简介

0 文章

0 评论

24 人气

关注发私信

束缚ｍ

文章 0 评论 0

关注

alipaysp_VP2a8Q4rgx

文章 0 评论 0

关注

α

文章 0 评论 0

关注

一口甜

文章 0 评论 0

关注

厌味

文章 0 评论 0

关注

转身泪倾城

文章 0 评论 0

友情链接

文江博客

创建 TTS 包

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

束缚ｍ

alipaysp_VP2a8Q4rgx

α

一口甜

厌味

转身泪倾城

友情链接

创建 TTS 包

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

束缚ｍ

alipaysp_VP2a8Q4rgx

α

一口甜

厌味

转身泪倾城

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。