Azure 文本到语音 API:仅提供单声道输出格式(无立体声格式)?

发布于 2025-01-09 20:11:55 字数 423 浏览 1 评论 0原文

我一直在使用 Azure SDK 开发文本转语音应用程序,并根据下面的参考页

https://learn.microsoft.com/en-us/dotnet/api/microsoft.cognitiveservices.speech.speechsynthesisoutputformat?view=azure-dotnet

似乎只有单声道输出格式可用,它是无法创建立体声格式的音频文件,对吗?如果有熟悉这方面的人,请帮我解答一下。

预先感谢您的帮助。

I've been developing a Text-to-Speech app with Azure SDK and according to reference page below

https://learn.microsoft.com/en-us/dotnet/api/microsoft.cognitiveservices.speech.speechsynthesisoutputformat?view=azure-dotnet

there seems to be only mono output formats available and it is not possible to create audio files in stereo format, correct? If there's anyone familiar with this, please help me out with your answer.

Thank you in advance for your help.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

雪落纷纷 2025-01-16 20:11:55

是的,Azure TTS 目前(2022 年 2 月)仅支持单声道格式。我建议您使用 sox 将音频文件从单声道转换为立体声。

Yes, only mono formats are supported as for now (Feb, 2022) by Azure TTS. I suggest you to use sox to convert the audio file from mono to stereo.

沉鱼一梦 2025-01-16 20:11:55

根据 Azure 认知服务基础文档,有近 20 种不同类型的音频输出类型,我们可以通过 REST API 使用 Azure SDK。

所有这些输出均为单声道类型。不是立体声类型。

默认情况下,使用 REST API 的 Azure SDK 提供单声道格式的音频。即单通道输出。

As per Azure cognitive services base documentation there are nearly 20 different types of audio output types, we can get using Azure SDK using REST API.

All those outputs are mono type only. Not stereo type.

By default, azure SDK using REST API is providing mono format of audio. That is single channel output.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文