文章/答案/技术大牛

发布

社区首页 >问答首页 >金融新闻的机器学习

问金融新闻的机器学习
EN

Stack Overflow用户

提问于 2014-08-27 09:33:30

回答 1查看 512关注 0票数 0

我有一份来自彭博、MarketWatch、CNN等金融网站的新闻文章列表。我想根据这些文章的财务相关性对它们进行分类，以了解是否涉及到任何金融危机或危机。

我用Python开发了一个使用NLTK的程序，它根据每一篇文章的财务相关性给出分数。

目前，我正在使用一个关键字列表/词典，如：

市场
金融
损失
贷款等

检查这个列表中有多少单词出现在新闻文章中，并为每个单词保持一个分数，然后把所有的单词加起来，得到一个整体的分数。

同样，我也有金融词组的清单/词汇：

未能与债权人达成协议
破产档案
第11章等的档案

从这个列表和上面的列表中添加分数，然后将一个整体的分数分配给一篇文章，这是它的相关性的一个指标。

我想把机器学习纳入这一过程，并希望从上述方法中获取已经分类的新闻文章作为培训集。

请帮助找到实现这一目标的最佳算法。

classification

nltk

python

machine-learning

回答 1

Stack Overflow用户

发布于 2014-08-27 12:32:32

这是一个分类机器学习问题，Logistic回归可以做到这一点：

Logistic回归维基百科

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/25523628

复制

相似问题

问金融新闻的机器学习
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问金融新闻的机器学习EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问金融新闻的机器学习
EN