在使用Microsoft文本到语音时，如何计算每个单词的持续时间？

发布于 2025-01-28 06:59:19 字数 258 浏览 2 评论 0原文

嗨，我正在使用Python中的Pyttsx3，该Python使用Microsoft SDK SAPI5.1文本将文本用于语音合成器来从文本中生成音频。我面临的问题是，它产生的语音速度不稳定，并且取决于文本的长度，单词的长度等。这意味着相同的单词将根据其文字更快或更慢。这些对我来说是挫折，因为我需要为我创建的程序正确工作的每个单词的时间戳，到目前为止，我尝试了不同的公式，它们都不是准确的。

有人有一个想法如何解决这个问题吗？（PS我不想使用语音分析来解决此问题，因为可靠性问题）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

逆蝶 2025-02-04 06:59:19

您需要设置事件处理程序以获取每个单词的通知。显然，PYTTSX使用Connect API来设置事件：

engine.connect('started-utterance', onStart)
engine.connect('started-word', onWord)
engine.connect('finished-utterance', onEnd)

OnWord签名具有持续时间（我相信）。

You need to set up event handlers to get a notification on each word. Apparently pyttsx uses the connect API to set up events:

engine.connect('started-utterance', onStart)
engine.connect('started-word', onWord)
engine.connect('finished-utterance', onEnd)

The onWord signature has the duration (I believe).

回复收藏 0 原文

~没有更多了~

关于作者

铜锣湾横着走

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

在使用Microsoft文本到语音时，如何计算每个单词的持续时间？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

在使用Microsoft文本到语音时，如何计算每个单词的持续时间？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。