首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将一个特定类别的文档从其他文档中分类

将一个特定类别的文档从其他文档中分类
EN

Data Science用户
提问于 2020-01-31 11:49:12
回答 1查看 54关注 0票数 3

我正在尝试构建一个分类器,如果一个文档是一个关于体育的文档,它就会进行分类。我有足够的体育文档样本来训练分类器,但是我无法想象我会如何样本“非体育文档”类别,因为可以有任何东西--书籍、新闻文章、简历、发票等等。如何处理这个问题?

我已经尝试过用我的运动文档样本训练一个类别的支持向量机分类器,但是结果证明它的准确率很差--大约6%。

我也读过有关PU的学习,你认为这是方法吗?还有其他选择吗?

谢谢。

EN

回答 1

Data Science用户

发布于 2020-01-31 12:45:50

您的问题确实是一个典型的一类分类问题,据我所知,单类支持向量机通常是一个很好的选择。

我认为你应该调查是什么导致了糟糕的表现:

  • 准确的评估可能不够充分,你至少需要找出错误往往是假正负还是假阴性,从而使用精确/回忆。
  • 您可以在特性级别上查看正在发生的事情:例如,我希望一些特定于体育的单词会被SVM赋予很大的权重。这也可能是一个问题的维度太高,也许你需要删除停止词或筛选出罕见的词,等等。
票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/67326

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档