我有两个相关的连续变量,我想使用它们的组合值来预测第三个二元变量的值。如何对值进行离散化/归类?我不是在寻找聚类算法,我特别感兴趣的是获得“有意义的”离散类别,我可以随后在贝叶斯分类器中使用。论文,书籍,在线课程的指针,都非常感谢!
发布于 2012-05-08 20:41:18
这是机器学习的本质和问题中研究最多的问题之一。
最小二乘回归,逻辑回归,支持向量机,随机森林被广泛应用于这类问题,称为二分类。
如果你的目标是对你的数据进行实用的分类,有几个库是可用的,比如python中的Scikits-learn和java中的weka。他们有一个很棒的文档。
但是,如果你想了解机器学习的本质,只需搜索(在这里或在谷歌上)机器学习资源。
发布于 2012-05-09 03:11:07
如果你想成为一个真正的书呆子,生成一堆不同的离散化,然后在上面训练一个分类器,然后通过特征来描述离散化,然后在上面运行一个分类器,看看哪种离散化是最好的!?
一般来说,离散化更像是一门艺术,并且很好地理解了输入变量范围的含义。
https://stackoverflow.com/questions/10496566
复制相似问题