返回介绍

3.实验方法与步骤

发布于 2024-01-28 21:41:24 字数 409 浏览 0 评论 0 收藏 0

1)打开Python,使用Pandas库中的read_csv()函数将关联分析的数据“demo/data/apriori.txt”读入到工作环境中,其中每个事务集为一行,每行事务集的分隔符默认为字符‘,’。如“A2,B1,C3,D3,E1,F1,H1”这样的一行数据为一个事务集。

2)将读入的“demo/data/apriori.txt”文档中的事务集转换为0,1矩阵,每一行事务集为0,1矩阵的一行,以方便规则的寻找与记录。

3)根据支持度找出频繁集,直至找到最大频繁集后停止。

4)根据置信度得到大于等于置信度的规则,即为Apriori算法所求的关联规则。

5)对Apriori算法输出的规则,编写过滤函数。因为该实验探究的是表8-15中6个症型系数与患者TNM分期的规则,所以只留下关联规则中后项有H的规则,得到的相应结果展示见表8-16。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文