我正面临着为我的数据挖掘任务选择正确的分类器的问题。
我正在使用统计方法标记网页,并使用1-4级来标记它们,1是最差的,而4是最好的。
以前,我使用支持向量机来训练系统,因为我使用的是二进制(1,0)标签then.But现在由于我切换到这个4类标签,我需要改变分类器,因为我认为支持向量机分类器只适用于两类分类(如果我错了,请纠正我)。
因此,您能否在这里提供一些建议,哪种分类器最适合我的分类目的。
提前感谢您的建议。
发布于 2010-10-11 04:59:52
存在多类支持向量机。和Weka一样,LibSVM也有一个实现。
通常,最好尝试几个分类器,以找出哪个分类器对您的数据效果最好。分类器类型和训练算法的选择远不如您选择的特征集重要。你可以尝试朴素贝叶斯,多类支持向量机,MaxEnt,投票感知器,或者你的库提供的任何东西。
发布于 2010-10-11 14:43:24
你说的是“序数分类”。它可以使用logistic regression、甚至using decision trees或人工神经网络修改using SVM (如前所述,它也是在libSVM中实现的)。
您甚至可以继续您的标签,执行您选择的回归分析,然后减少输出。我上面提到的大多数方法都是在幕后完成的。
祝好运
发布于 2010-10-25 18:17:44
您可以尝试查看Andrew NG Lecture,了解如何选择最适合您的ML算法,我认为这非常有启发性,它可能会为您提供一些关于如何管理数据的见解
https://stackoverflow.com/questions/3902137
复制相似问题