首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于文本分类的斯坦福CoreNLP情感分析

基于文本分类的斯坦福CoreNLP情感分析
EN

Stack Overflow用户
提问于 2016-04-17 20:51:49
回答 1查看 479关注 0票数 1

我正在做我的个人学士学位期末项目,大约50天后到期。我要创建的网站是一个用户可以分享他们觉得有趣的文章的链接(让他们感到快乐的东西)的网站。这是一种类似reddit的格式,用户可以在全球范围内发布文章,其他人可以根据文章的幸福感投票通过或否决文章。最热门的帖子将显示在列表的顶部,最不受欢迎的帖子显示在底部。

该项目更令人兴奋的部分是实现了一个NLP机器学习服务,它可以在网络上抓取与热门文章相似的文章,并自动将文章张贴到网站上(除了投票外,无需用户输入)。为了做到这一点,我正在考虑让斯坦福大学的CoreNLP服务在服务器上运行,它可以挑选出最热门的文章,根据它们的内容对它们进行分类(例如,一篇关于唐纳德·特朗普的文章应该自动生成“唐纳德·特朗普”、“共和党人”、“政治”等标签)。然后通过对文章进行情感分析,使用斯坦福大学的CoreNLP情感注释器,我可以看到公众对文章主题(即标签)的看法。然后通过使用网络爬虫,从网络上提取文章,并对提取的文章进行相似情感分析,我可以找到合适的文章发布到网站上。

然而,我还没能在斯坦福CoreNLP中找到任何用于文本分类的注释器。有没有什么办法可以实现我的想法。更好的是,有没有更好的方法来实现我想要实现的目标。

提前谢谢。

EN

回答 1

Stack Overflow用户

发布于 2016-09-23 18:13:27

我认为这个答案不会对发帖的人有所帮助,但希望其他人也能从中受益。我觉得问题中很多地方都写错了,缺少清晰的表达,但我认为你需要-

  • 是一款允许用户分享链接的应用程序,它允许用户从trending posts(使用点赞计数)中分享链接(Like):你需要应用一些算法(可能是主题建模)才能找到链接。
  • 是一个网络爬虫/爬行器,它可以让你在你的algorithm
  • you识别的主题上获得文章,也想给你的文章打一个极性分数(你实际上不需要coreNLP仅仅是为了这个原因,因为还有其他可用的包,我发现coreNLP很重-我从R运行它,并且经常遇到一些与

内存相关的错误。这对于其他与NLP相关的任务来说是很好的。)

关于你的最后一个问题,如果你使用的是R--这是代码:

代码语言:javascript
复制
 t<- "This tea is great" # the input text

annotatedStr <- annotateString(t) #annotator

sentiment <- getSentiment(annotation) #call to get your sentiment score
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36676743

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档