当前位置：文江博客话题详情

k-最近邻分类器但使用分布？

发布于 2024-11-02 09:30:35 字数 438 浏览 9 评论 0原文

我正在为一些二维数据构建分类器。

我有一些训练数据，我知道这些数据的类别，并将它们绘制在图表上以查看聚类情况。

对于观察者来说，存在明显的、独立的簇，但不幸的是它们分布在线上而不是紧密的簇中。一条线展开与水平线成大约 80 度角，另一条线与水平线成 45 度角，另一条线与水平线成大约 10 度角，但这三条线似乎都指向原点。

Clusters

我想对一些测试数据执行最近邻分类，从表面上看，如果测试数据与训练数据非常相似，3 个最近邻分类器可以正常工作，除非数据接近图的原点，在这种情况下，三个簇非常接近，并且可能会出现一些错误。

我应该为我的集群提出一些估计的高斯分布吗？如果是这样，我不确定如何将其与最近邻分类器结合起来？

感谢任何意见。

干杯

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

许你一世情深 2024-11-09 09:30:35

在运行最近邻之前，将所有点转换为 [r, angle]，并将 r 缩小到 0 到 90 的范围。
为什么？神经网络使用点和中心之间的欧几里得距离（在大多数实现中），
但你希望 distance(point, center ) 更像
sqrt( (点.r - 中心.r)^2 + (点.角度 - 中心.角度)^2 )
比 sqrt( (point.x - center.x)^2 + (point.y - center.y)^2 ) 。
将 r 缩小到 30 ？ 10？重量角度会比 r 更大，这似乎就是你想要的。