Java 中的垃圾邮件检测/垃圾邮件过滤系统

发布于 2024-11-16 07:10:36 字数 339 浏览 4 评论 0原文

我在一个网站上构建了一个私人消息系统,并且我想实现一个垃圾邮件过滤器,最好是用 Java 实现。

所以...我很感兴趣是否已经有一个 Java 库实现了这个,或者我是否必须开始构建自己的库。到目前为止我发现的是贝叶斯过滤: http://www.shiffman.net/teaching/ a2z/bayesian/

还有其他好的Java库吗?

你给我推荐什么?

谢谢

PS:该系统使用网站成员之间的私人消息,而不是电子邮件系统。

I've built a private messaging system on a site, and I want to implement a spam filter, preferably in Java.

So ... I'm interested if there a Java library implementing this already, or if I have to start building my own. What I found so far is this Bayesian Filtering: http://www.shiffman.net/teaching/a2z/bayesian/

Are there any other good Java libraries??

What do you recommend me?

Thanks

PS: the system is using private messages between site members and is not an email system.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

缱倦旧时光 2024-11-23 07:10:36

取决于垃圾邮件的类型。贝叶斯算法可以很好地抵御偏离主题的邮件,但如果垃圾邮件与合法邮件非常相似,您可能需要设置某种发件人信誉。 SO 的工作方式就是一个很好的例子;您需要通过参与赚取积分,然后才能使用该网站更强大的功能。如果垃圾邮件发送者以某种方式侵入高知名度用户的计算机,或者以其他方式设法劫持他们的声誉,这种情况可能会被破坏。

Depends on the type of spam. Bayesian is good against off-topic messages, but if the spam is very similar to legit messages, you might want to set up some sort of sender reputation. The way SO works is a good example; you need to earn points by participating before you can use the more powerful features of the site. This could be subverted if spammers were to somehow break into the computers of high-rep users, or otherwise manage to hijack their reputation.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文