当前位置：文江博客话题详情

我有一个 .mp3 文件。如何将 C 语言中的人声与其他声音分开？

发布于 2024-08-07 07:45:41 字数 176 浏览 4 评论 0原文

在 C 语言中是否有可能 [我知道一般来说这是可能的 -GOM玩家是吗]？让我开始吧...你说什么？

如何准确识别人声与其他声音的区别？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

心是晴朗的。 2024-08-14 07:45:41

MP3 播放器中的滤波器通常依赖于立体声录音室中的语音源（表演者）位于中心的事实。所以他们只是计算通道之间的差异。如果你给他们一个录音，其中表演者没有像他们那样定位，那么他们就会失败 - 声音不会被提取。

可靠的方法是使用语音检测器。这是一个非常复杂的问题，涉及核心数学和针对特定任务彻底调整算法。如果你这样做，你就从阅读语音编码（声码器）开始。

回复收藏 0 原文

远山浅 2024-08-14 07:45:41

此处讨论了这个确切的主题。它最初是对音频编码技术的讨论，但在上面的链接页面上有人说

这意味着无法从立体声信号中提取语音？

但有人指出，提取声音应该不会比消除声音困难。

我会让您进一步阅读，但我怀疑成功的提取可能依赖于与乐器相比相对较窄的声音频谱分布。

回复收藏 0 原文

寄离 2024-08-14 07:45:41

请注意，原则上不可能完美分离在一个音轨中混合在一起的不同声音。这就像当你将奶油混合到咖啡中一样 - 混合后，不可能将奶油和咖啡完美分离。

可能有智能信号处理技巧来获得可接受的结果，但一般来说，不可能将声音与音乐完美地分开。

回复收藏 0 原文

方觉久 2024-08-14 07:45:41

将人声与其他声音区分开来并非易事。如果您有其他声音的录音，那么您可以参考取消背景声音，这将为您留下人声。

如果背景噪声是某种随机噪声，您将通过使用某种形式的光谱过滤获得胜利。但这并不简单，需要相当多的尝试才能获得良好的结果。 Adobe Audition 有一个自适应频谱滤波器，我相信...

假设您的白噪声在整个录制频段上具有相当均匀的频率分布（在 44Khz 未压缩录制中，您谈论的是 0 到 22Khz）。然后添加一个声音就可以了。显然，声音使用与噪声相同的频率。人声的范围从 ~300Hz 到 ~3400Hz。显然，对音频进行带通会将您的语音范围缩小到 300 到 3400Hz。现在怎么办？你有一个声音，并且你有现在带通的白噪声。您需要以某种方式消除噪音并保持声音完好无损。有多种过滤方案，但都会在此过程中损害语音。

祝你好运，这真的不简单！

回复收藏 0 原文

所有深爱都是秘密 2024-08-14 07:45:41

查找独立成分分析 (ICA)

回复收藏 0 原文

浮萍、无处依 2024-08-14 07:45:41

其中 buf 具有 pcm wav 44100 采样率输入数据

int
voiceremoval (char *buf, int bytes, int bps, int nch)
{
    short int *samples = (short int *) buf;
    int numsamples = 0;
    int x = 0;
    numsamples = bytes / 2;
    x = numsamples;



    if (bps == 16)
      {
          short *a = samples;
          if (nch == 2)
              while (x--)
                {
                    int l, r;
                    l = a[1] - a[0];
                    r = a[0] - a[1];

                if (l < -32768)

                        l = -32768;

                if (l > 32767)

                        l = 32767;
                    if (r  32767)
                        r = 32767;
                    a[0] = -l;
                    a[1] = r;
                    a += 2;
                }
      }
    return 0;
}

Where buf has the pcm wav 44100 sample rate input data

int
voiceremoval (char *buf, int bytes, int bps, int nch)
{
    short int *samples = (short int *) buf;
    int numsamples = 0;
    int x = 0;
    numsamples = bytes / 2;
    x = numsamples;



    if (bps == 16)
      {
          short *a = samples;
          if (nch == 2)
              while (x--)
                {
                    int l, r;
                    l = a[1] - a[0];
                    r = a[0] - a[1];

                if (l < -32768)

                        l = -32768;

                if (l > 32767)

                        l = 32767;
                    if (r  32767)
                        r = 32767;
                    a[0] = -l;
                    a[1] = r;
                    a += 2;
                }
      }
    return 0;
}

回复收藏 0 原文

~没有更多了~