文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
3.实验方法与步骤
1)打开Python,使用Pandas库中的read_csv()函数将关联分析的数据“demo/data/apriori.txt”读入到工作环境中,其中每个事务集为一行,每行事务集的分隔符默认为字符‘,’。如“A2,B1,C3,D3,E1,F1,H1”这样的一行数据为一个事务集。
2)将读入的“demo/data/apriori.txt”文档中的事务集转换为0,1矩阵,每一行事务集为0,1矩阵的一行,以方便规则的寻找与记录。
3)根据支持度找出频繁集,直至找到最大频繁集后停止。
4)根据置信度得到大于等于置信度的规则,即为Apriori算法所求的关联规则。
5)对Apriori算法输出的规则,编写过滤函数。因为该实验探究的是表8-15中6个症型系数与患者TNM分期的规则,所以只留下关联规则中后项有H的规则,得到的相应结果展示见表8-16。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论