我希望将我们自己开发的各种机器学习算法的平台从C#移植到更强大的数据挖掘平台,如R。虽然很明显R在许多类型的数据挖掘任务中都很棒,但我不清楚它是否可以用于文本分类。
具体地说,我们从文本中提取二元组列表,然后将其分类为15个不同类别之一,例如:
Bigram list:珠宝,书籍,手表,鞋子,百货商店->类别:购物
我们希望既训练R中的模型,又连接到数据库,以便在更大的范围内执行此操作。
它可以在R中完成吗?
发布于 2011-11-02 16:05:32
嗯,我开始研究机器学习了,但我可能有一个建议:你考虑过Weka吗?有一堆不同的算法,还有一些文档。另外,还有一个使用Weka jars的R包RWeka。
编辑:还有一个很好的,全面的Witten等人的阅读。:Data mining,其中包含对Weka的广泛描述以及其他有趣的事情。查看API商机。
https://stackoverflow.com/questions/7975181
复制相似问题