文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
3.实验方法与步骤
1)把原始数据,即表14-5的数据读取到Python工作空间。根据业务需求只需截取后面4列的数据进行标准化即可。
2)对原始数据进行离差标准化,需要设置离散化区间为[0,1],同时考虑是否可以使用其他标准化方式。
3)构建层次聚类模型。比较scipy.cluster和sklearn.cluster两个子库的联系,在Scipy中使用linkage函数构建谱系聚类图,method参数设置为“ward”,metric参数设置为“euclidean”。
4)使用Scikit-Learn中的AgglomerativeClustering()函数对构建好的谱系聚类图进行分类,通过n_clusters参数指定需要分类的类别数为3。
5)使用scipy.cluster的dendrogram()函数对构建的谱系聚类图可视化,即画出其谱系聚类图并保存;针对每个群组使用Matplotlib画其趋势图并保存。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论