我试图对新闻标题中提到的一个特定主题进行情感分析。
最初,我使用TextBlob库进行情感分析以生成极性分数。但是新闻标题的极性分数并不准确。它将负面新闻归类为积极新闻。
例如:高盛( Goldman )首席执行官向马来西亚民众道歉。这个消息被归类为积极消息。
在此之后,我尝试使用spaCy库构建一个自定义模型。我在500个人工标记的新闻标题上训练了定制模型。在训练了这个模型之后,我在新的头条上发表了这篇文章。精度有所提高,但仍有改进的余地。金融新闻和社论标题的准确性特别差。
我的期望是建立一个能够准确预测新闻标题情绪的模型。这样我就可以在一段时间内勾勒出这一主题的情感趋势。
发布于 2021-01-12 13:57:56
https://datascience.stackexchange.com/questions/56950
复制相似问题