首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >垃圾邮件数据集,是否适合SpamAssasin?

垃圾邮件数据集,是否适合SpamAssasin?
EN

Server Fault用户
提问于 2015-12-15 14:35:36
回答 1查看 306关注 0票数 0

我想训练我的SpamAssasin过滤器,从2015年1月到2015年11月,我从该网站下载了所有垃圾邮件地址:Untanbled.org/垃圾邮件/

此外,我已经下载了我的火腿和垃圾邮件从我的个人gmail帐户。但是我所有来自gmail的火腿邮件都有大约2500封电子邮件,而这11封来自untroubled.org的邮件包含了大约410000封邮件。因此,火腿/垃圾邮件的关系约为1:160,因此,SpamAssassin过滤器将有太多垃圾邮件偏倚。

另一方面,这种垃圾邮件数据集网站主要被认为是垃圾邮件研究人员,而不是系统管理员。

那么,我的问题是,什么是系统管理通常做什么,或者,什么是推荐的做法?他们使用这种数据集吗?有那么危险吗?

EN

回答 1

Server Fault用户

发布于 2015-12-15 16:03:29

考虑到untroubled.org垃圾邮件收集方法的广泛性,我不认为使用这些数据来训练垃圾邮件杀手有任何问题。

您应该考虑您的电子邮件服务器的范围,并决定是否需要手动扫描大量已知的垃圾邮件。SA在根据内部规则过滤垃圾邮件方面做得很好,但是如果您有时间和倾向于手动扫描这些消息,它将不会给您的服务器带来任何问题。

票数 1
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/743162

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档