支持向量机 - 一个简单的解释？

发布于 2024-11-10 12:12:49 字数 443 浏览 6 评论 0原文

所以，我试图理解 SVM 算法是如何工作的，但我只是不知道如何转换 n 维平面点中的一些数据集，这些数据集具有数学意义，以便通过超平面分离点并对它们进行分类。

这里有一个示例，他们试图对以下内容的图片进行分类老虎和大象，他们说“我们将它们数字化为 100x100 像素图像，因此我们在 n 维平面上有 x，其中 n=10,000”，但我的问题是他们如何转换实际上仅代表点中的一些颜色代码的矩阵具有数学意义以便将它们分为两类？

也许有人可以在 2D 示例中向我解释这一点，因为我看到的任何图形表示都只是 2D，而不是 nD。 svm

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

俯瞰星空 2024-11-17 12:12:49

简短的答案是：它们不会转换矩阵，而是将矩阵中的每个元素视为一个维度（在机器学习中，每个元素将被称为特征）。
因此，他们需要对每个具有 100x100 = 10000 个特征的元素进行分类。在线性 SVM 情况下，他们使用超平面来实现这一点，将 10,000 维空间分为两个不同的区域。

更长的答案是：
考虑您的 2D 案例。现在，您想要分离一组二维元素。这意味着集合中的每个元素都可以在数学上描述为 2 元组，即：e = (x1, x2)。例如，在您的图中，一些完整的点可能是：{(1,3), (2,4)}，一些空心的点可能是{(4,2), (5,1)}。请注意，为了使用线性分类器对它们进行分类，您需要一个二维线性分类器，这将产生如下所示的决策规则：

e = (x1, x2)
if (w1 * x1 + w2 * x2) > C：判定e是一个完整的点。
否则：e 是空心的。

请注意，分类器是线性，因为它是 e 元素的线性组合。 “w”称为“权重”，“C”是决策阈值。如上所述，具有 2 个元素的线性函数只是一条线，这就是为什么在你的图中 H 是线。

现在，回到我们的 n 维情况，您可能会认为一条线无法解决问题。在 3D 情况下，我们需要一个平面： (w1 * x1 + w2 * x2 + w2 * x3) > C，在 n 维情况下，我们需要一个超平面： (w1 * x1 + w2 * x2 + ... + wn * xn) > C，这实在是难以想象，但更难画:-)。