1.3 分类器与预测器并无太大差别
因为上述的简单机器接受了一个输入,并做出应有的预测,输出结果,所以我们将其称为预测器。我们根据结果与已知真实示例进行比较所得到的误差,调整内部参数,使预测更加精确。
现在,我们来看看测量得到的花园中小虫子的宽度和长度。
在上图中,你可以清楚地看到两群小虫。毛虫细而长,瓢虫宽而短。
你还记得给定千米数,预测器试图找出正确的英里数这个示例吗?这台预测器的核心有一个可调节的线性函数。当你绘制输入输出的关系图时,线性函数输出的是直线。可调参数C改变了直线的斜率。
如果我们在这幅图上画上一条直线,会发生什么情况呢?
虽然我们不能使用先前将千米数转换成英里数时的同样方式,但是我们也许可以使用直线将不同性质的事物分开。
在上图中,如果直线可以将毛虫与瓢虫划分开来,那么这条直线就可以根据测量值对未知小虫进行分类。由于有一半的毛虫与瓢虫在分界线的同一侧,因此上述的直线并没有做到这一点。
让我们再次调整斜率,尝试不同的直线,看看会发生什么情况。
这一次,这条直线真是一无是处!它根本没有将两种小虫区分开来。
让我们再试一次:
这条直线好多了!这条直线整齐地将瓢虫与毛虫区分开来了。现在,我们可以用这条直线作为小虫的分类器。
我们假设没有未经发现的其他类型的小虫,现在来说,这样假设是没有问题的,因为我们只是希望说明构建一台简单的分类器的思路。
设想一下,下一次,计算机使用机器手臂抓起一只新的小虫,测量其宽度和长度,然后它可以使用上面的分界线,将小虫正确归类为毛虫或瓢虫。
看看下图,你可以看到未知的小虫位于直线之上,因此这是一条毛虫。这种分类非常简单,但是非常强大!
我们已经看到了,在简单的预测器中,如何使用线性函数对先前未知的数据进行分类。
但是,我们忽略了一个至关重要的因素。我们如何得到正确的斜率呢?我们如何改进不能很好划分这两种小虫的分界线呢?
这个问题的答案处于神经网络学习的核心地带。让我们继续看下一节。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论