补偿通道效应

发布于 2024-11-18 11:21:43 字数 533 浏览 1 评论 0原文

我正在尝试开发一个由计算机对录制句子的质量进行评级的系统。该系统有三种运行模式：

当人使用麦克风和混音器装置录制句子时。
当用户通过固定电话录音时。
当用户通过手机录制时。

我注意到使用上述 3 个来源的录音得到的分数按以下顺序排列：Mic_score >固定电话分数> mobile_score

上面的顺序很可能是由于编解码器和信道特性的影响。我的问题是：

可以采取什么措施来补偿通道/编解码器引入的工件，以获得跨通道的一致分数？如果某种反向过滤，那么请提供一些我可以开始使用的链接。
如何检测输入语音是在哪个通道录制的？使用隐马尔可夫模型？

编辑1：我无权详细介绍标准。我从麦克风、固定电话和手机（对于同一句话（以及通过三种媒体同样说出的内容）获得的当前分数约为 80、66、41。这种差异可能是由于渠道效应造成的。如果内容并且句子的说话方式是相同的，那么我正在寻找一种对分数进行归一化的算法（它们不必相同，但应该接近）。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

情定在深秋 2024-11-25 11:21:43

很可能是音质不同。
您是否尝试过听一些例子？

您还可以使用任何频谱分析仪来详细查看该数据。我建议http://www.baudline.com/。您应该注意的事项：本底噪声和语音之间的距离。

另请注意说出字母 t、f 和 s 时的高频噪声爆发。在低质量的线条中，这些字母之间的差异消失了。

为什么要扭曲质量衡量标准？对质量给出客观的回应似乎更有意义。

回复收藏 0 原文

盛夏尉蓝 2024-11-25 11:21:43

固定电话编解码器将删除 4 kHz 左右及以上的所有频率。作为有损压缩过程的一部分，手机编解码器将丢弃更多信息。除非您有关于原始音频内容的另一个侧面信息通道，否则没有可靠的方法来恢复被丢弃的音频。

标准化的最佳选择是对音频进行低通滤波以匹配 8 kHz 电信编解码器，并通过某种蜂窝标准压缩算法（可能有针对您的特定移动蜂窝协议发布的算法）运行结果。这应该会将所有 3 个信号的质量降低到大致相同。

回复收藏 0 原文

~没有更多了~

关于作者

北音执念

暂无简介

0 文章

0 评论

24 人气

关注发私信

Gabu-gabumon

文章 0 评论 0

关注

qq_CgiN62

文章 0 评论 0

关注

荔枝明

文章 0 评论 0

关注

赏烟花じ飞满天

文章 0 评论 0

关注

独守阴晴ぅ圆缺

文章 0 评论 0

关注

¤→小豸慧

文章 0 评论 0

友情链接

文江博客

补偿通道效应

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签