文本转语音（语音生成）和语音转文本（语音识别）API？

发布于 2024-11-15 05:02:54 字数 35 浏览 4 评论 0原文

是否有适用于桌面或浏览器环境的已知 API 的完整列表？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

千と千尋 2024-11-22 05:02:54

我将重新整理并更新用 C 语言、Java 语言或 PHP 语言进行语音识别？。这绝不是全面的，但它可能是您的一个开始

通过几个月来观察这些问题，我发现大多数开发人员的选择都是这样分解的：

Windows 人员 - 使用 .Net 或 Microsoft 的 System.Speech 功能。语音并安装 Microsoft 提供的免费识别器。 Windows 7 包含完整的语音引擎。其他可免费下载。同一引擎有一个 C++ API，称为 SAPI。请参阅 http://msdn.microsoft.com/en-us/magazine/ cc163663.aspx。或 http://msdn.microsoft.com/ en-us/library/ms723627(v=vs.85).aspx。有关适用于 Windows 的 Microsoft 引擎的更多背景信息
System.Speech 之间有什么区别.Recognition 和 Microsoft.Speech.Recognition？

Linux 人员 - Sphinx 似乎有很多追随者。请参阅 http://cmusphinx.sourceforge.net/ 和 http://cmusphinx.sourceforge.net/wiki/

商业产品 - Nuance，Loquendo, AT&T、IBM、其他。每个都为各种语言提供自己的 SDK 和库。

在线服务 - Nuance、Yapme, ispeech.org、vlingo、其他。 Nuance 改进了他们的开发者计划，现在将让您免费访问他们的服务进行开发。 Yap（我相信）最近由亚马逊购买，因此我们可能会看到一些变化。

当然这也可能有帮助 - http://en.wikipedia.org/wiki/List_of_speech_recognition_software

有一个 Java 语音 API。请参阅 Java 语音 API 中的 javax.speech.recognition http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html。我相信你还是得找到一个支持这个API的语音引擎。我不认为 Sphinx 完全支持它 - http://cmusphinx。 sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi

还有很多其他问题：
需要适用于 Linux 的文本转语音和语音识别工具
和 pyspeech (python) - Transcribe mp3 files? 谈论 http://code.google.com/p/pyspeech/。您可能还想查看http://code.google.com/p/dragonfly/

回复收藏 0 原文

平生欢 2024-11-22 05:02:54

领先的文本转语音（语音生成）API 供应商是 YAKiToMe! 和 iSpeech。 YAKiToMe！是我使用的一个，因为我最喜欢他们的语音质量，而且价格最便宜（大部分是免费的）。他们支持多种语言的男性和女性使用者。一些语音供应商，如 Acapella、Nuance、Loquendo 和 iVona，拥有不错的语音，但使用起来往往很昂贵。

回复收藏 0 原文

她比我温柔 2024-11-22 05:02:54

您可以这样做：
注意：它是来自google的api，所以它只适用于chrome浏览器。

（在此处查看现场演示并下载完整源代码 http://purpledesign.in/blog/?p=33 )

定义一个按钮

<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" />

并定义您想要在 javascript 文件中的函数中执行的操作

，如下

   function processspeech()
   {
     var speechtext=$("#speech").val();
     var elem = document.getElementById("test");
     elem.value = speechtext;
     var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+  speechtext + "</span>\" <br />*Is this what you said???";
    notify(notification);
}

所示

<textarea> id="test"></textarea>

语音写在文本区域中

Here is how you can do it:
Note: it is an api from google, so it only works in chrome browser.

(See live demo and download full source code here http://purpledesign.in/blog/?p=33)

define a button

<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" />

and define what you want to do in a function in your javascript file

Like This

   function processspeech()
   {
     var speechtext=$("#speech").val();
     var elem = document.getElementById("test");
     elem.value = speechtext;
     var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+  speechtext + "</span>\" <br />*Is this what you said???";
    notify(notification);
}

Here