自组织映射（SOM）中的降维问题

发布于 2024-12-15 06:50:35 字数 150 浏览 6 评论 0原文

自组织地图据称能够在较小的维度空间上可视化/聚类高维数据。我对这个说法的理解有些困难。

考虑六维数据集，码本向量/参考向量也是六维的。根据SOM算法，这些参考向量的更新也是在六维向量空间中进行的。如果我们考虑二维地图，我应该如何理解六维数据空间和二维地图空间之间的映射？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

雪花飘飘的天空 2024-12-22 06:50:35

N 维输入空间和 2D SOM 空间之间的映射是一个非线性投影尽可能多的拓扑。
这意味着有关距离和角度的信息在此过程中丢失，但保留了点之间的邻近关系（即输入空间中彼此接近的 2 个点在 SOM 空间中应该接近）。
我对“SOM 的作用是什么？”有了最深入的了解。在 3D RGB 色彩空间上使用它：SOM 的工作在这种情况下可以很容易地形象化，并且应该有助于理解这个概念。

回复收藏 0 原文

内心激荡 2024-12-22 06:50:35

2D 自组织映射 (SOM) 将输入向量分布到 2D 平面上。从数学上讲，SOM 是一个三维矩阵，第三维的长度由输入数据的长度给出。为了可视化 SOM，通常需要计算 U 矩阵。 U 矩阵为 SOM 的每个神经元给出了所考虑的神经元与其邻居之间的平均欧几里德距离。
U-matrix
生成的 2D 矩阵允许将高维空间可视化到 2D 平面上。高值给出了簇之间的障碍，在下图中表示为深蓝色山谷：
U-matrix_example
这个U矩阵来自于这个3D数据集的学习：
在此处输入图像描述
这里是 3D 原始空间中的 U 矩阵：