Python 中的音频分离
我正在从事一个书呆子项目以获取乐趣。 该项目是录制在录音带上的模拟视频。 挑战在于带宽非常有限。 我有一种以 24fps 录制彩色视频和单声道音频的方法。 我的视频工作正常,但需要一些音频方面的帮助。 这是我必须使用的信号:
注意:使用 YUV 色彩空间
左通道: 同步脉冲和 Y(亮度)数据
右通道: U& V(色度)数据 混合着 单声道音频(14kHz 幅度调制)
我不确定如何将颜色数据与音频分开。 我已经用 numpy 研究了一些 FFT,但还没有完全理解它。
基本上我需要的是一个带滤波器来分离 13990Hz - 14010Hz (以考虑哇和颤振)
I'm working on a nerd project for fun.
The project is analog video recorded onto an audio cassette.
The challenge lies in the very limited bandwidth.
I have a method to record color video at 24fps along with mono audio.
I got the video stuff working but need some help with the audio.
Here is the signal I have to work with:
Note: using YUV color space
Left channel:
Sync Pulses &
Y (luma) data
Right channel:
U & V (chroma) data
mixed with
Mono audio (Amplitude Modulated at 14kHz)
I'm not sure how to separate the color data from the audio.
I've looked into FFT with numpy a bit but am not fully understanding it.
Basically what I need is a band filter to separate 13990Hz - 14010Hz (to account for wow and flutter)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
好的,这是一个小的测试代码,显示了它的工作原理。
如果您想查看完整的代码以及信号的波动和输出的示例视频,请参见一个链接:
Ok here is a little test code that shows how this works.
If you want to check out the full code along with a wav of the signal and an example video of the output here's a link:
https://drive.google.com/drive/folders/18ogpK4n43d_Q0tjdmlm2uIRZBIrRu01y?usp=sharing