聚类排名
我正在分析R中的数据,其中预测变量可用,但没有响应变量。使用无监督的学习(K-均值),我已经确定了数据中的模式。但是我需要根据集群的整体表现进行对(例如:学生在考试标记和课外标记上的数据)。聚类在R中使用什么技术?
I'm analyzing a data in R where predictor variables are available but there is no response variable. Using unsupervised learning (k-means) I have identified patterns in the data. But I need to rank the clusters according to their overall performance (example: student's data on exam marks and co-curricular marks). What technique do I use after clustering in R?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
cluster
kmeans输出的属性为您提供了每个数据点所在的群集的索引。从kmeans
文档中获取的示例数据:现在,您的评估功能(例如,您的评估功能列值)可以单独应用于每个群集:
或者更好的是,请使用某种聚合功能,例如
tapply
gentreg> gentregate ,例如:它
在这一点上应该给您您能够根据需要对聚合函数的值进行排名。
The
cluster
attribute of the kmeans output gives you the index of which cluster each data point is in. Example data taken fromkmeans
documentation:Now, your evaluation function (e.g. mean of column values) can be applied to each cluster individually:
Or better still, use some kind of aggregation function, e.g.
tapply
oraggregate
, e.g.:which gives
At this point you should be able to rank the values of the aggregation function as needed.