当前位置：文江博客话题详情

Apriori 算法：具有频繁 (k-1) 子集意味着频繁？

发布于 2024-10-18 02:11:50 字数 238 浏览 0 评论 0原文

我一直盯着一本描述挖掘频繁项集的 Apriori 算法的书里的下面一行，我似乎无法理解它

请注意，给定一个候选 k-项集，我们只需要检查它是否 (k- 1)-子集是频繁的，因为Apriori算法使用逐级搜索策略。

在上面，候选意味着是潜在的频繁k项集。

很明显，频繁 k 项集的 (k-1) 子集是频繁的，但即使所有 (k-1) 子集都是频繁的，我也没有看到其他含义。但也许我的阅读方式是错误的？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

所有深爱都是秘密 2024-10-25 02:11:50

“很明显，频繁 k 项集的 (k-1) 子集是频繁的，但即使所有 (k-1) 子集都是频繁的，我也没有看到其他含义。”

你是对的，另一个含义是不正确的。 (k-1) 子集用于生成您需要测试频繁性或支持度（如原始论文所称）的 k 项集。您需要测试对从 (k-1) 子集生成的 k 项集的支持。

原始论文非常易读，可以在此处获取。第 4 页第 1 列有一个示例，使这里的想法非常清晰。

回复收藏 0 原文

梦过后 2024-10-25 02:11:50

另一个含义是不正确的。但如果一个子集不频繁，则该项集也不会频繁。 APriori算法执行子集检查以消除一些不频繁的项集。但在此之后，还需要检查每个候选人的支持度。为此，Apriori 算法将扫描数据库。

如果你想更好地描述 Apriori，我建议查看这本书的章节：

http://www-users.cs.umn.edu/~kumar/dmbook/ch6.pdf

它用非常简单的术语解释了 Apriori、FPGrowth 和关联规则挖掘。它比原始的 Apriori 文章更容易阅读。

回复收藏 0 原文

~没有更多了~

关于作者

一袭白衣梦中忆

暂无简介

0 文章

0 评论

24 人气

关注发私信

烙印

文章 0 评论 0

关注

singlesman

文章 0 评论 0

关注

给自己一个微笑

文章 0 评论 0

关注

独孤求败

文章 0 评论 0

关注

晨钟暮鼓

文章 0 评论 0

关注

我是自愿种绣球花的

文章 0 评论 0

友情链接

文江博客

Apriori 算法：具有频繁 (k-1) 子集意味着频繁？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者