首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >无监督文本分类

无监督文本分类
EN

Stack Overflow用户
提问于 2016-01-26 02:23:16
回答 1查看 1.3K关注 0票数 1

我已经使用Python3和sklearn构建了一个垃圾邮件分类器。对于垃圾邮件/火腿分类,我使用了支持向量机,它有相当好的准确率(~99%)

我现在面临的问题是,一旦我对垃圾邮件进行了分类,我想自动地对它们进行分类,例如:与政治相关的邮件,与音乐相关的邮件等等,并将它们放入特定的桶中。

挑战是我不能用特定类型的邮件训练算法,因为我不知道收件箱中会出现什么类型的邮件,所以我被困在这个阶段。如果有人能分享一些解决办法,那就太好了。谢谢。

EN

回答 1

Stack Overflow用户

发布于 2016-01-26 02:34:22

你可以看看Latent Dirichlet allocation (topic modelling技术)。但此模型将返回未标记的电子邮件组。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34999564

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档