首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >文本分类

文本分类
EN

Data Science用户
提问于 2017-03-15 20:12:00
回答 3查看 271关注 0票数 1

本文采用支持向量机算法进行文本分类。我需要知道在哪里可以找到twitter数据集,以及如何在weka工具或任何其他工具中使用它?

EN

回答 3

Data Science用户

发布于 2017-12-01 00:58:48

Twitter有限制共享完整数据集的规则,而不是限制只共享tweet ids (请参阅此讨论开发商协议)。像双弧这样的工具可以通过调用Twitter和检索信息来“补充”tweet元数据。Twitter有速率限制,这使得这是一个有点慢的过程。

有关在R中工作的包,请参阅RTextTools或查看RWeka,它将R与Java之间的差距缩小为使用Weka。如果使用Python,还可以使用scikit-learn的svm实现。

票数 1
EN

Data Science用户

发布于 2017-03-15 20:24:02

这是我找到的几个网站。我不是一个R程序员,所以我不知道任何Weka工具和如何使用他们,但希望这有帮助。你可以找到他们这里这里

票数 0
EN

Data Science用户

发布于 2020-06-08 07:15:42

这个twitter数据集集合可能会帮助您找到要查找的数据集。主要是情感分析数据集,但也有适度分类数据集。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/17624

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档