首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将论坛讨论整理成分类文章或信息的算法/方法?

将论坛讨论整理成分类文章或信息的算法/方法?
EN

Stack Overflow用户
提问于 2011-11-28 01:06:36
回答 2查看 202关注 0票数 0

我正在为网络设计和编码一个基于知识的社区共享系统(论坛,问答,学生,教授和专家之间的文章共享)。

我需要使用一些数据挖掘/文本处理技术/算法来分析专家和学生之间的讨论(讨论使用标签进行分类),并在特定的类似主题上创建适当的笔记和汇编。

对于这样的算法或可用的工具,我不是专家。如果有人能为我提供一些指点或解释我如何解决这个问题,那就太好了。

谢谢!!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-01-21 23:19:09

对于文章的分类,你可以使用LSA (潜在语义分析)技术。

您可以检查这些工具以进行文本处理。

  1. LingPipe:处理文本的工具包: text.
  2. Lucene
  3. Solr:功能强大的文本搜索工具
票数 0
EN

Stack Overflow用户

发布于 2011-12-01 02:59:57

开始阅读文本挖掘。你的问题没有通用的答案,因为它不够精确。你必须更准确地确定你的目标,然后人们才能为这些目标提出方法。你的“分析”太宽泛了。计算单词的数量也是“分析”!

那么:你想识别什么,分组还是预测?

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8287314

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档