当前位置：文江博客话题详情

识别文件中的音频样本

发布于 2024-11-29 16:54:34 字数 197 浏览 1 评论 0原文

我希望能够识别我拥有的音频文件（mp3）中的音频样本（由用户提供）。

mp3 文件是我出于测试目的而保留的广播流，并且我有节目的预卷。我想在文件中识别它并获取它在文件中播放的时间戳。

注意：该解决方案可以采用以下任何一种编程语言：Java、Python 或 C++。我不知道如何分析视频文件，任何有关此主题的参考都会有所帮助。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

注定孤独终老 2024-12-06 16:54:34

这个问题属于音频指纹识别的范畴。如果您已将样本与歌曲相匹配，那么您肯定会知道样本在歌曲中出现的时间戳。 Shazam 背后的人写了一篇很棒的论文，描述了他们的技术： http://www.ee.columbia.edu/~dpwe/papers/Wang03-shazam.pdf 他们基本上挑选出频谱图中的局部最大值并根据它们创建一个哈希值相对位置。

以下是关于音频指纹识别算法的精彩评论：http://mtg. upf.edu/files/publications/MMSP-2002-pcano.pdf

无论如何，您可能会大量使用 FFT 和频谱图。这篇文章讨论了如何在 Python 中做到这一点。

回复收藏 0 原文