我正在为android开发一个垃圾邮件检测应用程序,我使用贝叶斯分类来检测垃圾邮件。我想知道的是,我是否应该使用由50条火腿消息和50条垃圾邮件组成的培训集,还是应该进行基于用户的内容培训?对申请的成效有何影响?我知道这可能是一个广泛的讨论,但我希望得到一个确切的答案,而不是这里的讨论。
发布于 2014-03-06 08:19:33
看来你需要数千条训练信息。
请注意,垃圾邮件发送者已经发现了通过这种过滤器的方法,例如"v1agra“之类的错误。对分类器的迭代改进可能会赶上它们当前的技术。
过滤看起来是个很好的起点,尤指。它对深度文章的引用。
https://stackoverflow.com/questions/22218289
复制相似问题