我试着在一条红线上做情绪分析。我面临的问题是,一些免费的云NLP API(谷歌自然语言,Azure文本分析等)每月只允许5000次免费通话。我试图看看是否可以将一些注释连在一起,直到每次调用字符的最大限度,以便在空闲层中得到更多的评论。
发布于 2018-03-09 08:03:54
有趣的问题--如果评论是独立的,而且与一点关系都没有,那么连接或平均可能会使你得到一个中性的分数--类似于一系列抛硬币的结果是0.5,而不是1或0。这将使不是很有用的。
但是,假设您正在围绕一个post(而不是对一个subreddit中的多个帖子的线程进行分析)对reddit线程进行情感分析,那么很可能通过连接或平均获得相同的结果。reddit线程中的注释通常是相关的,或者是正的或负的(或者完全不相关)。因此,您应该在您的用例中使用您提议的级联方法来获得这种感觉。
我的理论(还没有数据支持)是,使用平均或串联将倾向于将你的情绪集中在中性,你将不会看到强大的正面或负面。
https://stackoverflow.com/questions/49180432
复制相似问题