我正在做我的个人学士学位期末项目,大约50天后到期。我要创建的网站是一个用户可以分享他们觉得有趣的文章的链接(让他们感到快乐的东西)的网站。这是一种类似reddit的格式,用户可以在全球范围内发布文章,其他人可以根据文章的幸福感投票通过或否决文章。最热门的帖子将显示在列表的顶部,最不受欢迎的帖子显示在底部。
该项目更令人兴奋的部分是实现了一个NLP机器学习服务,它可以在网络上抓取与热门文章相似的文章,并自动将文章张贴到网站上(除了投票外,无需用户输入)。为了做到这一点,我正在考虑让斯坦福大学的CoreNLP服务在服务器上运行,它可以挑选出最热门的文章,根据它们的内容对它们进行分类(例如,一篇关于唐纳德·特朗普的文章应该自动生成“唐纳德·特朗普”、“共和党人”、“政治”等标签)。然后通过对文章进行情感分析,使用斯坦福大学的CoreNLP情感注释器,我可以看到公众对文章主题(即标签)的看法。然后通过使用网络爬虫,从网络上提取文章,并对提取的文章进行相似情感分析,我可以找到合适的文章发布到网站上。
然而,我还没能在斯坦福CoreNLP中找到任何用于文本分类的注释器。有没有什么办法可以实现我的想法。更好的是,有没有更好的方法来实现我想要实现的目标。
提前谢谢。
发布于 2016-09-23 18:13:27
我认为这个答案不会对发帖的人有所帮助,但希望其他人也能从中受益。我觉得问题中很多地方都写错了,缺少清晰的表达,但我认为你需要-
内存相关的错误。这对于其他与NLP相关的任务来说是很好的。)
关于你的最后一个问题,如果你使用的是R--这是代码:
t<- "This tea is great" # the input text
annotatedStr <- annotateString(t) #annotator
sentiment <- getSentiment(annotation) #call to get your sentiment scorehttps://stackoverflow.com/questions/36676743
复制相似问题