嗨,我有一个关于我正在尝试开发的系统的概念性问题,该系统试图对电子邮件进行分类。我有大量(>100k)非垃圾邮件和大量未分类邮件。那么,有没有可能使用一种方法(也许是贝叶斯)来检测垃圾邮件,而不需要垃圾邮件的数据集?我真的需要对垃圾邮件进行分类吗?
发布于 2013-05-29 16:20:06
是的,你能做到。结果很可能比有监督的方法更糟糕。一般的问题通常被称为异常检测。这个想法是为您的数据创建一个模型,并为每个新实例决定它是否来自此模型。有很多方法可以做到这一点,选择正确的方法是困难的。你可以开始学习here了。
https://stackoverflow.com/questions/16804874
复制相似问题