首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >金融新闻的机器学习

金融新闻的机器学习
EN

Stack Overflow用户
提问于 2014-08-27 09:33:30
回答 1查看 512关注 0票数 0

我有一份来自彭博、MarketWatch、CNN等金融网站的新闻文章列表。我想根据这些文章的财务相关性对它们进行分类,以了解是否涉及到任何金融危机或危机。

我用Python开发了一个使用NLTK的程序,它根据每一篇文章的财务相关性给出分数。

目前,我正在使用一个关键字列表/词典,如:

  • 市场
  • 金融
  • 损失
  • 贷款等

检查这个列表中有多少单词出现在新闻文章中,并为每个单词保持一个分数,然后把所有的单词加起来,得到一个整体的分数。

同样,我也有金融词组的清单/词汇:

  • 未能与债权人达成协议
  • 破产档案
  • 第11章等的档案

从这个列表和上面的列表中添加分数,然后将一个整体的分数分配给一篇文章,这是它的相关性的一个指标。

我想把机器学习纳入这一过程,并希望从上述方法中获取已经分类的新闻文章作为培训集。

请帮助找到实现这一目标的最佳算法。

EN

回答 1

Stack Overflow用户

发布于 2014-08-27 12:32:32

这是一个分类机器学习问题,Logistic回归可以做到这一点:

Logistic回归维基百科

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25523628

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档