当前位置：文江博客话题详情

nlp neural-network phoneme

Elman SRN 的单词/音素语料库（英语）

发布于 2024-12-03 10:24:11 字数 575 浏览 7 评论 0原文

我正在写一个 Elman 简单循环网络。我想给它单词序列，其中每个单词都是音素序列，并且我想要大量的训练和测试数据。

所以，我需要的是一个英语单词的语料库，以及它们组成的音素，写成类似 ARPAbet 或 SAMPA 的形式。英式英语会很好，但不是必需的，只要我知道我在处理什么。有什么建议吗？

我目前没有时间也没有兴趣编写一些代码来从口头或书面数据中派生出单词所组成的音素，所以请不要这样做。

注意：我知道 CMU 发音词典，但它声称它仅基于 ARPBet 符号集 - 有人知道是否确实存在任何差异，如果有的话它们是什么？（如果没有，那么我可以使用它......）

编辑：CMUPD 0.7a 符号列表 - 元音可能有词汇重音，并且有变体（ARPABET 标准符号）表明这一点。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

生生漫 2024-12-10 10:24:11

CMUdict 应该没问题。 “Arpabet 符号集”就是Arpabet 的意思。如果存在任何细微差异，应在 CMUdict 文档中进行解释。

如果您需要比将各个单词的字典发音串在一起更接近现实生活的数据，请查找按语音转录的语料库，例如 TIMIT。

回复收藏 0 原文

~没有更多了~

关于作者

肤浅与狂妄

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

yuanzihao09

文章 0 评论 0

1337793151

文章 0 评论 0

横笛休吹塞上声

文章 0 评论 0

你在我安

文章 0 评论 0

qq_QhAHT0kB

文章 0 评论 0

aaaa123451

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文