当前位置：文江博客话题详情

想知道贝叶斯分类器是否是正确的方法？

发布于 2024-10-15 08:30:39 字数 286 浏览 5 评论 0原文

我想知道贝叶斯分类器对于应用程序是否有意义，其中相同的短语“冷饮”（例如）在与某些事物（啤酒、苏打水）相关时是“好”，但在与其他事物（牛排、苏打水）相关时是“坏”。披萨、汉堡）？

我想知道的是，训练一个贝叶斯分类器（“啤酒冷”和“苏打冷”是“好”）是否会抵消训练“冷牛排”和“冷汉堡”是“坏”）。

或者，是否可以（正确地）训练贝叶斯“冷饮”可能是“好”或“坏”，具体取决于它与什么相关？

我在这里和其他地方找到了很多关于贝叶斯的好信息，但无法确定它是否适合这种类型的应用程序，其中短语好或坏的答案是“取决于”？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我早已燃尽 2024-10-22 08:30:39

朴素贝叶斯分类器假设属性之间是独立的。例如，假设您有以下数据：

苹果水果红色 BAD
苹果水果绿色坏
香蕉果黄GOOD
番茄蔬菜红GOOD

独立性是指属性（名称、果实、颜色）独立；例如，“苹果”可以是“水果”或“蔬菜”。在这种情况下，属性“名称”和“水果”是相关的，因此朴素贝叶斯分类器太天真了（它可能会将“苹果果黄”分类为“坏”，因为它是一个苹果，而且它是一个水果 - 但并非所有苹果水果？）。

为了回答你原来的问题，朴素贝叶斯分类器假设类别（好或坏）独立地取决于每个属性，但事实并非如此——我喜欢热披萨和冷苏打水。

编辑：如果您正在寻找具有一定实用性但理论上可能存在大量 I 型和 II 型错误的分类器，朴素贝叶斯就是这样一个分类器。朴素贝叶斯总比没有好，但是使用不太朴素的分类器具有可衡量的价值。

回复收藏 0 原文

安静被遗忘 2024-10-22 08:30:39

我不会像丹尼尔建议的那样很快就驳回贝叶斯。
贝叶斯的质量（数学上的性能）首先取决于训练数据的数量和质量，以及您在开发算法时所做的假设。

给你一个简短的例子，如果你只喂它{'啤酒冷'=>; ：好，“披萨冷”=> :bad}“冷”这个词实际上不会影响分类。它只会决定所有啤酒都好，所有披萨都不好（看看它有多聪明？:)）

无论如何，答案太短，无法详细解释这一点，我建议阅读 Paul Graham 的文章，了解他如何开发垃圾邮件过滤器 - 请注意，他基于贝叶斯制作了自己的算法，而不仅仅是现成的分类器。根据我（到目前为止很短）的经验，似乎您最好跟随他为手头的特定问题开发特定版本的算法，这样您就可以控制各种特定领域的假设。

如果您有兴趣，可以在此处关注我的尝试（在 ruby 中）： http:// /arubyguy.com/2011/03/03/bayes-classification-update/

回复收藏 0 原文

~没有更多了~