我想将文本文档分为四类。另外,我有很多已经分类的样本,可以用于训练。我想让算法在飞行中学习..请建议一个最优的算法,以满足这一要求。
发布于 2011-02-14 22:42:17
如果您所说的“即时”是指在线学习(其中训练和分类可以交错),我建议使用-nearest neighbor算法。它可以在Weka和TiMBL包中找到。
感知器也能做到这一点。
在这种情况下,“最佳”并不是一个定义明确的术语。
发布于 2011-02-15 17:10:37
有几种算法可以在飞行中学习。例如:K-近邻,朴素贝叶斯,神经网络。您可以尝试这些方法在样本语料库上的适用性。
发布于 2011-02-21 05:12:15
由于您有未标记的数据,因此您可能希望使用模型,这将有所帮助。我首先想到的是非线性NCA:Learning a Nonlinear Embedding by Preserving Class Neighbourhood Structure, (Salakhutdinov, Hinton)。
https://stackoverflow.com/questions/4993292
复制相似问题