比较 wav 文件

发布于 2024-10-05 12:53:35 字数 679 浏览 4 评论 0原文

我有一个（大部分）工作程序来比较两个 wav 文件，看看较小的文件是否在较大的文件中。这是用java完成的。

我首先确保两个 wav 文件都是规范波形格式。然后，我使用 AudioInputStream 从中获取数据的字节数组。我以一定帧速率（例如现在：4096 字节）的块取出数据。我获取较小输入的第一个块，然后遍历较大输入中相同大小的块。

我获取这些块并使用相同的数据创建双数组。我得到他们的 FFT，并使用相关函数在相关系数结果数组中找到峰值。然后我转到较小输入的下一个块，看看是否出现类似的峰值。

这是有效的，当文件相同时峰值很明显，并且大多数时候结果是正确的。我没有得到误报。然而，我确实得到了假阴性。

这是因为我不确定如何“对齐”数据。较小的文件可以来自较大文件中的任何点。大多数时候，这是通过我这样做的分块方法捕获的。但有时，尽管文件应返回高相关性，但文件似乎不同，并且未找到峰值。

如果我取出其中一个漏报（无峰值）的文件，并对它们进行一些调整，在它们的末尾或开头剪掉几千个字节，然后再次运行该程序，它会突然找到峰值，并且它是一个非常明确的匹配。因此，它确实有效，只是不知何故找不到相关性明显的峰值。我的相关函数会转换 FFT 以使它们匹配，因此我认为这将涵盖所有内容，但显然我没有涵盖所有数据。

我不确定如何将较小文件的块“对齐”到较大文件中出现的位置，以便关联函数能够识别相关发生的位置。一切正常，我只需要消除误报。有什么建议吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

￡冰雨忧蓝° 2024-10-12 12:53:35

使用卷积滤波器比较两个波形。它会告诉您匹配是否发生以及在哪里发生。计算卷积的快速算法是可用。

回复收藏 0 原文

情话墙 2024-10-12 12:53:35

这称为匹配过滤器。由于分块，您的实施正在受到影响。传统上，您将输入视为连续流，从每个样本开始提取一个块，然后进行相关。因此，如果您的输入长度为 10k 个样本，则最终会运行过滤器 10k 次，每次将 4k 个样本放入过滤器中（在您的示例中）。然而，这很慢。有几种方法可以加快速度：

使用小块（例如 256 个点）来加快 FFT 计算速度。您的相关性可能看起来不太好，从而导致更多误报，但也许您可以列出可能的匹配项，然后返回并查看更大的块。
不要从输入中的每个样本开始获取缓冲区，而是从每个第 512 个样本开始获取 4k 缓冲区，然后进行相关性（类似于 Marcelo Cantos 在评论中的建议）。然后，在中间周围的 512 个样本中查找峰值，因为时间偏移会导致尖峰偏移。此外，边缘处额外的不相关样本将导致峰值不是全值，因此如果有的话，您需要放宽该约束。同样，这可能会导致更多误报，因此您必须再次采用列表方法。

在实现细节方面，我假设您已经从较小的文件中预先计算了块？另外，您没有说明是否检查时域或频域的相关性。您可以在频域中寻找平坦幅度，这相当于时域中的尖峰，以节省逆 FFT。您必须做一些实验来确定频谱的平坦程度，但这可能会大大缩短时间。

回复收藏 0 原文