返回介绍

设置开发和测试集

基本误差分析

偏差和方差

学习曲线

与人类水平的表现相比

不同发行版的培训和测试

调试推理算法

端到端学习

按零件进行误差分析

总结

组件误差分析与人类水平对比

发布于 2024-08-16 12:42:34 字数 6508 浏览 0 评论 0 收藏 0

对学习算法进行误差分析就像使用数据科学来分析 ML 系统的错误,以获得有关下一步该做什么的建议。从基本角度来看,组件误差分析告诉我们:哪些组件的性能是最值得尽力去改进的。

假设你有一个客户在网站上购物的数据集,数据科学家可能有许多不同的方法来分析数据。她可能会得出许多不同的结论——关于网站是否应该提高价格,关于通过不同营销活动获得的客户的终身价值等等。并不存在一种 “正确” 的方法来对数据集进行分析并得出许多可能有用的见解。同样,也没有一种 “正确” 的方法来进行误差分析。通过这些章节,你已经学习了许多最常见的设计模式,用于得到有关 ML 系统的有用见解,但你也可以自由尝试其他误差分析的方法。

让我们回到自动驾驶应用程序的讨论中,其中汽车检测算法输出附近汽车的位置(也可能是速度),行人检测算法输出附近行人的位置,这两个输出最终用于为当前车辆进行路径规划。

如果想要调试该流水线,却不希望严格遵循上一章中提到的过程,你可以非正式地询问:

  1. 在检测汽车时,汽车检测组件与人类水平表现相差多少?
  2. 在检测行人时,行人检测组件与人类水平表现相差多少?
  3. 整个系统的性能与人类表现相差多少?在这里,人类水平的表现假定:人类必须仅根据前两个流水线组件的输出(而不是访问摄像机图像)来规划汽车的路径。换句话说,当人类只得到相同的输入时,路径规划组件的性能与人类的性能相较如何?

如果你发现其中一个组件远低于人类水平的表现,那么你现在可以专注于提高该组件的性能。

当我们尝试自动化人类可以做的事情时,许多误差分析过程将表现得最好,因此可以对人类水平的表现进行基准测试。 我们前面的大多数例子都有这个隐含的假设。 如果你正在构建 ML系统,其中最终输出或某些中间组件正在做甚至连人类都无法做好的事情,那么这些过程中的一些步骤将不起作用。

这是解决人类可解决的问题的另一个优势 - 你拥有更强大的误差分析工具,因此你可以更有效地优先处理团队的工作。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文