我计划做我的最后一年的自然语言处理(使用NLTK)项目,我的兴趣领域是评论总结从社交媒体网站如Facebook。例如,我试图做这样的事情:
图片中的随机Facebook评论:
现在,所有这些注释将被映射(使用基于模板的注释摘要技术)如下所示:
3人们觉得这幅画“很美”。
输出将由单词“漂亮”组成,因为它在评论中比“漂亮”(还有美丽和漂亮是同义词这一事实).In顺序更常用,为了完成这项任务,我将使用跟踪关键字频率和关键字分数等方法(在这个场景中,“漂亮”和“漂亮”有一个非常接近的分数)。这是最好的方法吗?
到目前为止,通过我的研究,我已经提出了以下的论文,但没有一篇论文涉及这样的评论摘要:
这一领域中涉及类似问题的其他文件有哪些?
除此之外,我还希望我的总结器在每一个摘要task.How中都得到改进,我是否在这方面应用了机器学习?
发布于 2014-10-12 09:13:05
主题模型聚类是您要寻找的内容。
在Google学者上搜索“主题模型聚类”将为您提供许多关于主题模型聚类的参考。
要理解它们,除了一般机器学习的基础知识之外,您还需要熟悉以下任务的方法。
https://stackoverflow.com/questions/26312002
复制相似问题