当前位置：文江博客话题详情

cluster-analysis machine-learning data-mining fuzzy

模糊 c- 表示分类数据

发布于 2024-12-08 17:23:58 字数 449 浏览 5 评论 0原文

模糊 c 均值能否应用于非数值数据集？即分类或混合数字和分类.. 如果是（我希望如此：（）：

我们如何计算聚类中心？

如果否，替代方案是什么..如何对这些数据进行模糊聚类？

我需要响应，请帮助

注意：我已经使用 Jacard 系数来计算2点之间的距离，但仍然没有找到计算聚类中心的方法，请参阅附件在此处输入图像描述

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

遇见了你 2024-12-15 17:23:58

您必须将数据转换为数字形式。有多种方法可以做到这一点，其中两种是：

使用特征计数向量（常见于文本分类等）
使用one-hot表示，其中可以采用n的分类特征不同的值表示为 n 位的字符串，如果某个要素的第 i 个值，则仅设置第 i 位。允许的范围。

两者都是许多机器学习程序在幕后进行的非常常见的转换。此外，您可能想尝试一种与欧几里得度量不同的度量。特别是。使用 one-hot 表示，但根据数据，L1 范数（曼哈顿/城市街区距离）可能更合适。

除此之外，只需将给定的公式应用于转换后的数据集即可。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

Promise

文章 0 评论 0

qq_lbRlsh

文章 0 评论 0

待＂谢繁草

文章 0 评论 0

yy2010hell

文章 0 评论 0

漫无边际

文章 0 评论 0

傲娇萝莉攻

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文