首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >二值分类算法

二值分类算法
EN

Data Science用户
提问于 2020-09-13 09:34:45
回答 1查看 67关注 0票数 1

我有一个具有大量功能(大约3000)和二进制目标变量的数据集。之所以我有太多的特性,是因为我的数据集中有一个热编码--许多分类变量。

我认为逻辑回归可能只适用于少量的特性。

因此,考虑到我有很多特征,我应该使用哪种算法来获得更好的分类分数?

我的目标是增加中华民国-AUC的这一分类任务的度量.

使用支持向量机还是神经网络更好?

EN

回答 1

Data Science用户

回答已采纳

发布于 2020-09-14 14:45:43

我想到的第一件事就是做不同的编码。有一些方法可以处理高基数的分类数据,例如:标签编码或著名的目标编码。在此之前,我将建议更改编码类型。

但是,既然你的问题是用哪个预测器来处理小数据和空间数据。我将继续使用logistic回归、决策树或支持向量机。当数据很小时,所有算法的工作原理都很相似。

像兰登森林这样的东西可能表现得很好,因为它们会引导数据,这往往是一种用替换来采样数据的方法。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/81632

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档