返回介绍

设置开发和测试集

基本误差分析

偏差和方差

学习曲线

与人类水平的表现相比

不同发行版的培训和测试

调试推理算法

端到端学习

按零件进行误差分析

总结

直接学习更为丰富的输出

发布于 2024-08-16 12:42:34 字数 4368 浏览 0 评论 0 收藏 0

一个图像分类算法可以输入一个图像 $x$ ,并输出一个表示对象类别的整数。那么一个算法可以输出一个完整的句子来对图像进行描述吗?

举个例子——

输入 $x$ 为:

输出 $y$ 为:“一辆黄色的公共汽车在路上开着,背景是绿色的树和绿色的草。 ”

传统的监督学习应用学得一个函数:$h:X \mapsto Y$ ,其中输出 $Y$ 通常是一个整数或者实数。例如:

问题XY
垃圾邮件分类邮件垃圾邮件/非垃圾邮件 (0/1)
图像识别图像整数值标签
房价预测房屋特征美元价格
产品推荐产品与用户特征购买机率

端到端深度学习中最令人兴奋的进展之一是,它让我们直接学习比数字复杂得多的 $y$ . 在上面的图像配字示例中,你可以使用一个神经网络输入一个图像($x$),并直接输出一个标题($y$).

下面有更多的例子:

问题XY文献引用
图像配字图像文本Mao et al., 2014
机器翻译英语文本法语文本Mao et al., 2014
问题回答(文本,问题)对回答文本Bordes et al., 2015
语音识别音频转录Hannun et al., 2015
文本转语音文本特征音频van der Oord et al., 2016

这体现了深度学习的高速变化趋势:当你有正确的(输入,输出)标签对的时候,有时可以进行端到端学习,即使输出是一个句子、图像、音频,或者其它的比一个数字更丰富的输出形式。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文