我是数据挖掘的新手,目前在RapidMiner上为TOI的一篇在线新闻文章工作。我的目标是得到显示文章中提到的最重要的东西的结果,或者找到隐藏在其中的有价值的信息。
我已经完成了对文章"TOI宣言“http://timesofindia.indiatimes.com/home/specials/lok-sabha-elections-2014/news/TOI-manifesto-An-agenda-for-the-new-government/articleshow/31973967.cms的文档处理。我已经应用了标记化,过滤和ngram,并得到了一些结果。
我被困在这里了。我不知道如何继续下去。我应该在RapidMiner中使用哪种技术/算法来获得所需的结果?
发布于 2014-04-06 05:25:13
您正在寻找的不是数据挖掘。数据挖掘是一种先进的统计方法。
通常侧重于定量分析。
您正在寻找自然语言处理。您没有大型数据库。
您只有一个文档。你不想要定量的结果,但要有质量的。您使用了错误的工具。
https://stackoverflow.com/questions/22885133
复制相似问题