语音识别：检测日语假名（辅音和元音）

发布于 2024-12-14 15:51:16 字数 687 浏览 0 评论 0原文

我想找到一些开源代码（尽管我会选择闭源产品）来转换传入的日语假名音频流（即辅音+元音对）并几乎实时打印出来。

但是，我想将这些基本声音单位用于我自己的自定义目的，因此我不需要任何试图提取真正日语单词的高级处理。我只想得到原始假名。

有人知道这样的技术吗？

我今天刚刚了解到日语“字母表”基本上是假名的 10x5 网格。 10 列（空 + 9 个辅音）和 5 行（元音）

，每个元素称为“假名”，语言由这些假名的序列组成；这些是基本构建块。

这肯定会对语音识别算法产生很大的影响。

对于西方语言，我所知道的所有商业语音识别引擎均源自 CMUSphinx，它在三元模型上运行：它用唯一的 MFCC 向量表示三个音素之间的每个运动，并计算出一个话语最可能的三元序列（从中它可以简单地推导出音素，然后遍历其字典）单词三元组，找出最可能的句子）。

但对于像日语这样的语言，我猜这可能不再是最有效的算法。

相反，尝试捕获每个假名或假名对可能是有意义的。

...这将是 2 克或 4 克。但不是3！

外面有什么吗？或者他们只是使用与西方世界相同的发动机？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

七婞 2024-12-21 15:51:17

Julius 有日语的声学和语言模型。
尝试一下，看看它是否适合您的应用程序。

我不知道他们训练了语言模型，但 Julius 可以支持任何顺序的 n-gram
反向传球。在forward方面，是支持bigram。反过来使用 4-gram 是很常见的
经过。两个 LM 均使用 Julius 工具组合在一起。

路易斯
ASR实验室

回复收藏 0 原文

~没有更多了~

关于作者

·深蓝

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

语音识别：检测日语假名（辅音和元音）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

亚希

cyp

北漠

11223456

坠似风落

游魂

友情链接

语音识别：检测日语假名（辅音和元音）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

亚希

cyp

北漠

11223456

坠似风落

游魂

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。