小型嵌入式合成语音库/建议

发布于 2024-12-22 19:13:11 字数 656 浏览 0 评论 0原文

对于代码大小比语音质量更重要的 PIC 和/或 ARM 嵌入式系统，是否有任何易于使用的免费或廉价语音合成库？如今，1兆封装似乎被认为是“紧凑”的，但许多微控制器都比这个小。早在 1980 年代，Apple 就聘请了一家承包商来生产 Macintalk，它以 26K 封装提供了合理质量的语音，并在 7.16MHz 68000 上运行，而一个名为 SAM 的程序可以产生不太好但仍然可用的语音，具有在 1MHz 6502 上运行的 16K 软件包。SpeakJet 在某种类型的 PIC 上运行语音合成算法。

我可能不会特别需要发出语音，但希望能够说出由许多预设单词组成的消息。显然，可以简单地预先录制所有消息，但对于例如 100 个单词的词汇表，我认为存储 16K 的代码加上可能 1K 的语音字符串将比存储 100 个单词的音频更紧凑。

或者，如果我想存储 100 个单词的音频，生成一组自然流动的单词的最佳方法是什么？在老式语音合成器上，任何给定的单词都可以用三种方式说出：中性语调变化、下降语调变化（就像后面跟一个句点）或上升语调变化（后面跟一个问号）。具有中性变形的单词可以以任何顺序拼接在一起并且听起来不错。不过，我发现的文本到波形工具似乎喜欢添加更精细的变形细节，如果单词被分割并重新排序，这些细节听起来会“关闭”。是否有任何工具旨在产生可以很好地串联和拼接的波？如果我确实使用这样的工具，哪种音频格式最适合存储波形，以便在小型微控制器上进行有效解码？

原文

分享到QQ

分享到微博