首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >文本挖掘单个文本文档

文本挖掘单个文本文档
EN

Stack Overflow用户
提问于 2014-04-06 02:40:47
回答 1查看 323关注 0票数 0

我是数据挖掘的新手,目前在RapidMiner上为TOI的一篇在线新闻文章工作。我的目标是得到显示文章中提到的最重要的东西的结果,或者找到隐藏在其中的有价值的信息。

我已经完成了对文章"TOI宣言“http://timesofindia.indiatimes.com/home/specials/lok-sabha-elections-2014/news/TOI-manifesto-An-agenda-for-the-new-government/articleshow/31973967.cms的文档处理。我已经应用了标记化,过滤和ngram,并得到了一些结果。

我被困在这里了。我不知道如何继续下去。我应该在RapidMiner中使用哪种技术/算法来获得所需的结果?

EN

回答 1

Stack Overflow用户

发布于 2014-04-06 05:25:13

您正在寻找的不是数据挖掘。数据挖掘是一种先进的统计方法。

通常侧重于定量分析。

您正在寻找自然语言处理。您没有大型数据库。

您只有一个文档。你不想要定量的结果,但要有质量的。您使用了错误的工具。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22885133

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档