返回介绍

数学基础

统计学习

深度学习

工具

Scala

1.3 反馈环

发布于 2023-07-17 23:38:23 字数 1019 浏览 0 评论 0 收藏 0

  1. 实时机器学习系统的一个关键特征是:如果系统随着时间的推移而更新,它们通常最终会影响自己的行为。这导致了一种分析债务的形式form,其中很难在给定模型发布之前预测模型的行为。

    这些反馈环feedback loop可以有不同的形式,但是如果它们随着时间缓慢发生(例如在模型更新不是很频繁时 ),那么反馈环很难检测和解决。

  2. 直接反馈环Direct Feedback Loops:模型可能会直接影响它自己未来训练数据的选择(例如推荐算法)。通常在实践中使用标准的监督学习算法,但是理论上正确的解决方案是使用老虎机算法bandit algorithms 。这里的问题是老虎机算法(例如上下文老虎机contextual bandits)不一定能够很好地适应scale well 现实世界问题通常所需的动作空间action spaces 的大小。

    可以通过使用一定量的随机化、或者通过隔离数据的某些部分不受给定模型的影响,从而缓解这些影响。

  3. 隐式反馈环Hidden Feedback Loops:直接反馈环的分析成本很高,但是至少机器学习研究人员可能会自然发现并进行研究。一种更困难的情况是隐式反馈环,其中两个系统通过真实世界间接地相互影响。

    这方面的一个例子是,如果两个系统独立地确定网页的各个方面facets,例如一个系统选择要展示的产品、另一个系统选择相关的评论。改进一个系统可能会导致另一个系统的行为发生变化,因为用户开始或多或少地点击另一个部分从而响应这些变化。

    注意,这些隐式反馈可能存在于完全不相交disjoint 的系统之间。考虑来自两家不同投资公司的两个股市预测模型的案例。一方的改进improvements (或者更可怕的bugs )可能会影响另一方的出价bidding和购买 buying行为。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文