返回介绍

9.2 获取音乐数据

发布于 2024-01-30 22:34:09 字数 826 浏览 0 评论 0 收藏 0

我们将要使用的是GTZAN数据集,它是一个经常用于乐曲体裁分类任务的数据集。它把音乐分成10种体裁。为了简化问题,我们只使用其中的6种:古典、爵士、乡村、流行、摇滚和金属音乐。这个数据集包含每种体裁100首乐曲的前30秒的数据。我们可以在http://opihi.cs.uvic.ca/sound/genres.tar.gz 下载这个数据集。音轨是22 050 Hz(每秒22 050次读入)单声道WAV格式的。

转换成音频格式

确实,如果想要在我们的MP3集合上测试分类器,我们并不能获取到很多信息。这是因为MP3是一种有损音乐压缩格式,它把人耳感知不到的部分都截掉了。这种方式有利于存储,因为用MP3格式你可以把10倍数量的歌曲放进你的设备。然而,对于我们的工作来说,MP3格式并不是很好。用WAV格式的音乐文件进行分类,会相对容易一些。所以,当我们要给音乐分类的时候,就需要转换MP3文件的格式。

提示  如果你没有转换工具,你可以看一下sox:http://sox.sourceforge.net 。它号称音频处理中的瑞士军刀。我们同意这个大胆的断言。

把所有音乐文件转换成WAV格式有一个好处,那就是它可以直接利用SciPy工具包读取:

>>> sample_rate, X = scipy.io.wavfile.read(wave_filename)

在这里,X 包含的是样本,而sample_rate 就是音频采样的速度。我们利用这些信息浏览一下音乐文件,来获得对这些数据的初步印象。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文