我正在为网络设计和编码一个基于知识的社区共享系统(论坛,问答,学生,教授和专家之间的文章共享)。
我需要使用一些数据挖掘/文本处理技术/算法来分析专家和学生之间的讨论(讨论使用标签进行分类),并在特定的类似主题上创建适当的笔记和汇编。
对于这样的算法或可用的工具,我不是专家。如果有人能为我提供一些指点或解释我如何解决这个问题,那就太好了。
谢谢!!
发布于 2012-01-21 23:19:09
对于文章的分类,你可以使用LSA (潜在语义分析)技术。
您可以检查这些工具以进行文本处理。
发布于 2011-12-01 02:59:57
开始阅读文本挖掘。你的问题没有通用的答案,因为它不够精确。你必须更准确地确定你的目标,然后人们才能为这些目标提出方法。你的“分析”太宽泛了。计算单词的数量也是“分析”!
那么:你想识别什么,分组还是预测?
https://stackoverflow.com/questions/8287314
复制相似问题