当前位置：文江博客话题详情

使用神经网络进行基音检测

发布于 2024-08-19 23:38:21 字数 1436 浏览 17 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

花间憩 2024-08-26 23:38:21

它已经起作用的原因可能很简单，因为您没有训练它选择一个且仅一个输出（至少我假设您没有）。在简单的情况下，当输出只是输入和权重的点积时，权重将成为相应音高的匹配滤波器。由于一切都是线性的，如果多个匹配的滤波器同时看到良好的匹配（如复调音符的情况），多个输出将同时被激活。由于您的网络可能包含非线性，因此情况会稍微复杂一些，但想法可能是相同的。

关于改进它的方法，使用复调样本进行训练当然是一种可能性。另一种可能性是切换到线性滤波器。复调声音的 DFT 基本上是每个单独声音的 DFT 之和。您希望输入的线性组合成为输出的相应线性组合，因此线性滤波器是合适的。

顺便说一句，为什么首先要使用神经网络呢？看起来，仅查看 DFT 并获取最大频率就可以更轻松地获得更好的结果。

回复收藏 0 原文

葮薆情 2024-08-26 23:38:21

Anssi Klapuri 是一位备受尊敬的音频研究人员，他发表了一种使用神经网络对复调录音进行音高检测的方法。

您可能想将 Klapuri 的方法与您的方法进行比较。他的硕士论文音乐自动转录的信号处理方法对此进行了全面描述。你可以在网上找到他的许多论文，或者购买他的书，其中解释了他的算法和测试结果。他的硕士论文链接如下。

https://www.cs.tut.fi/sgn/ arg/klap/phd/klap_phd.pdf

复调录音的音高检测是一个非常困难的主题，并且包含许多争议 - 准备好进行大量阅读。下面的链接包含另一种对和弦录音进行音高检测的方法，该方法是我为名为 PitchScope Player 的免费应用程序开发的。我的 C++ 源代码可在 GitHub.com 上找到，并在下面的链接中引用。 PitchScope Player 的免费可执行版本也可在网络上获取并在 Windows 上运行。

实时音调检测

回复收藏 0 原文

音栖息无 2024-08-26 23:38:21

我尝试发展 CTRNN（连续时间递归神经网络）来检测 2 个正弦波之间的差异。我取得了一定的成功，但从未有时间跟踪这些神经元的银行（即类似于耳蜗的带）。

回复收藏 0 原文

坚持沉默 2024-08-26 23:38:21

一种可能的方法是使用遗传编程（GP）来生成简短的代码片段，检测音高。通过这种方式，您将能够生成音调检测如何工作的规则，该规则有望是人类可读的。

回复收藏 0 原文

~没有更多了~

关于作者

坚持沉默

暂无简介

文章

937 人气

关注发私信

友情链接

文江博客

使用神经网络进行基音检测

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

882123719

朦胧时间

alipaysp_DQOPIT9H5Y

眼藏柔

微信用户

寻梦旅人

友情链接

使用神经网络进行基音检测

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

882123719

朦胧时间

alipaysp_DQOPIT9H5Y

眼藏柔

微信用户

寻梦旅人

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。