我已经使用Python3和sklearn构建了一个垃圾邮件分类器。对于垃圾邮件/火腿分类,我使用了支持向量机,它有相当好的准确率(~99%)
我现在面临的问题是,一旦我对垃圾邮件进行了分类,我想自动地对它们进行分类,例如:与政治相关的邮件,与音乐相关的邮件等等,并将它们放入特定的桶中。
挑战是我不能用特定类型的邮件训练算法,因为我不知道收件箱中会出现什么类型的邮件,所以我被困在这个阶段。如果有人能分享一些解决办法,那就太好了。谢谢。
发布于 2016-01-26 02:34:22
你可以看看Latent Dirichlet allocation (topic modelling技术)。但此模型将返回未标记的电子邮件组。
https://stackoverflow.com/questions/34999564
复制相似问题