首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >是否有无监督培训的情感论坛数据?

是否有无监督培训的情感论坛数据?
EN

Stack Overflow用户
提问于 2018-10-17 07:41:46
回答 1查看 293关注 0票数 0

我最近完成了一个机器学习课程,并想制作一个论坛情绪分析工具,将其应用于股票相关论坛。

其想法是:

  1. 捕获(文本挖掘)用户与他们的评论,并评估他们的意见的感情(积极,消极,中立)。
  2. 捕捉这些评论之后发生的事情(股票市场),并相应地给用户分配一个权重(如果用户的情绪是对的,并且市场遵循相同的方向,则更大的权重)。
  3. 将这些评论作为预测市场走向的工具。

事实上,我自己做这个(注意论坛),加上我自己的技术分析和强制性的尽职调查,它一直对我很好。我只是想让它自动化一点,甚至允许一个程序使用我的一些帐户(先进行纸面交易,如果它能在一个真实的帐户中分配一些钱)。

这将是我的第一个机器学习项目(作为一个概念的证明),因此,任何意见将非常感谢。

我发现的最大问题是,我想要制作一个无监督培训,并且我需要一个样本数据集来进行培训。

问题:是否有任何已知的论坛情绪数据可用于无监督的培训?

我发现了一些情绪数据集(twitter、imbd、amazon评论),但它们非常特定于它们的利基(短消息、电影、产品.)但我在找更一般的东西。

EN

回答 1

Stack Overflow用户

发布于 2018-10-18 11:15:03

因为您正在寻找一种无监督的方法,所以您可以使用与“真实情况”相匹配的任何数据集。文本挖掘和情感分析通常是针对手头的问题而量身定做的,因此很容易直接从实际数据开始。最好的方法是建立一个刮板,直接抓取你想要分析的论坛帖子。您可以使用Python (漂亮的汤/selenium)轻松地构建刮板。网上有很多很好的教程,例如:https://www.dataquest.io/blog/web-scraping-tutorial-python/

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52849649

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档