我正在构建一个人工智能,与自然语言处理集成在我的学校项目应用程序(一个应用程序专门为贸易商)。我在想,在股票市场中,最常用来表达消极(或积极)的词是什么?如果某只股票的价值正在下降(或增加),那么什么词最有可能出现在报纸上?
最终目标:将一篇从网上获取的文章归类为描述股票的增减。
是否有任何公开的免费数据集处理这一问题?
否则,是否有将句子归类为趋势或不趋势的数据集?
任何建议,帮助,甚至合作将是非常感谢的!
发布于 2018-04-09 02:32:52
您可以使用深度学习网络来生成情感分析。预先训练过的模型可以使用向量化的词表进行训练,这些词列表通常与积极和消极相关联。然而,这些可能不能很好地推广到您的特定用例。
由于股票的历史性质,你可以轻松地从在线资源编译你自己的数据库。例如,您可以在数据集中构造实例,如下所示。将2001年2月5日与Google相关的文章中的所有单词标记化,那么目标标签可以是2001年2月7日的股票价值。你可以随心所欲地选择时间间隔。如果您这样做了大量实例,您的数据集应该能够包含一些概念,哪些词在文章中会导致股票价格上升或降低。
https://datascience.stackexchange.com/questions/30049
复制相似问题