首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何对连续数据进行分类?

如何对连续数据进行分类?
EN

Stack Overflow用户
提问于 2012-05-08 18:08:42
回答 2查看 1.3K关注 0票数 1

我有两个相关的连续变量,我想使用它们的组合值来预测第三个二元变量的值。如何对值进行离散化/归类?我不是在寻找聚类算法,我特别感兴趣的是获得“有意义的”离散类别,我可以随后在贝叶斯分类器中使用。论文,书籍,在线课程的指针,都非常感谢!

EN

回答 2

Stack Overflow用户

发布于 2012-05-08 20:41:18

这是机器学习的本质和问题中研究最多的问题之一。

最小二乘回归,逻辑回归,支持向量机,随机森林被广泛应用于这类问题,称为二分类。

如果你的目标是对你的数据进行实用的分类,有几个库是可用的,比如python中的Scikits-learn和java中的weka。他们有一个很棒的文档。

但是,如果你想了解机器学习的本质,只需搜索(在这里或在谷歌上)机器学习资源。

票数 0
EN

Stack Overflow用户

发布于 2012-05-09 03:11:07

如果你想成为一个真正的书呆子,生成一堆不同的离散化,然后在上面训练一个分类器,然后通过特征来描述离散化,然后在上面运行一个分类器,看看哪种离散化是最好的!?

一般来说,离散化更像是一门艺术,并且很好地理解了输入变量范围的含义。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10496566

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档