首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何从博客评论的原始情感数据集创建用于斯坦福核心nlp情感分析的训练数据集(基于树)?

如何从博客评论的原始情感数据集创建用于斯坦福核心nlp情感分析的训练数据集(基于树)?
EN

Stack Overflow用户
提问于 2015-07-31 02:59:56
回答 1查看 377关注 0票数 0

我有一个博客评论的训练集,如何为递归深度模型创建训练数据?

例如示例数据

(4 (4 (2 A) (4 (3 (3温馨) (2,)) (3搞笑) (3 (2,) (3 (4 (4精彩) (2胶片)

EN

回答 1

Stack Overflow用户

发布于 2015-08-01 14:42:47

如您所示,RNN情感模型需要在每个树节点上使用情感数据标记的已解析语言的训练集。

为了保证解析器的质量,你需要自己(也就是手动地)对这些注释进行。在the original paper中有一些关于如何通过众包创建训练数据的细节。有了足够的动力、时间和金钱,你也可以做同样的事情。

一种较小的替代方案是首先使用标准解析器和情感模型来自动标记数据,然后手动修复解析和情感错误。如果您正在处理的文本域与用于训练模型的文本域相似,则这可能是可行的。由于您使用的是博客评论,不幸的是情况并非如此!

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31731953

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档