返回介绍

3.实验方法与步骤

发布于 2024-01-28 21:41:24 字数 433 浏览 0 评论 0 收藏 0

1)把原始数据,即表14-5的数据读取到Python工作空间。根据业务需求只需截取后面4列的数据进行标准化即可。

2)对原始数据进行离差标准化,需要设置离散化区间为[0,1],同时考虑是否可以使用其他标准化方式。

3)构建层次聚类模型。比较scipy.cluster和sklearn.cluster两个子库的联系,在Scipy中使用linkage函数构建谱系聚类图,method参数设置为“ward”,metric参数设置为“euclidean”。

4)使用Scikit-Learn中的AgglomerativeClustering()函数对构建好的谱系聚类图进行分类,通过n_clusters参数指定需要分类的类别数为3。

5)使用scipy.cluster的dendrogram()函数对构建的谱系聚类图可视化,即画出其谱系聚类图并保存;针对每个群组使用Matplotlib画其趋势图并保存。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文