首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >主题建模具有一个“多数主题”和多个“少数主题”的语料库

主题建模具有一个“多数主题”和多个“少数主题”的语料库
EN

Stack Overflow用户
提问于 2015-03-20 23:42:00
回答 1查看 72关注 0票数 0

我有一个文档集合,其中大部分都是关于同一主题的,其余的基本上都是随机主题。我希望将这些文件分为“多数主题”或“少数主题”。如果我在这个只有2个主题的语料库上使用主题建模算法,会发生什么?语料库是否会被划分为“多数主题”和“少数主题”,即使“少数主题”可能彼此没有太多相似之处?

EN

回答 1

Stack Overflow用户

发布于 2015-03-25 04:20:06

您可以使用MonkeyLearn来实现这一点。

您可以创建包含两个主题的自定义分类器:“多数主题”和“少数主题”。您必须为每个类别添加一些训练样本,以便MonkeyLearn可以学习预测每个类别。

在训练分类器之后,它可以通过其API与任何编程语言集成。

你可以在这里免费试用MonkeyLearn:http://www.monkeylearn.com

如果您有任何问题,请在这里留言或发送电子邮件给我们hello@monkeylearn.com,我在这里帮助您。

干杯,

费德里科

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29170465

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档