首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >训练算法的分类数据预处理

训练算法的分类数据预处理
EN

Data Science用户
提问于 2022-04-29 18:21:59
回答 1查看 111关注 0票数 0

我有一个训练数据集,其中"Output“col的值依赖于三列(这是分类的不订货)。

代码语言:javascript
复制
Inp1    Inp2        Inp3               Output
A,B,C   AI,UI,JI    Apple,Bat,Dog      Animals
L,M,N   LI,DO,LI    Lawn, Moon, Noon   Noun
X,Y,Z   LI,AI,UI    Xmas,Yemen,Zombie  Extras

因此,基于这些训练数据,我需要一个ML算法来预测任何传入的数据行,这样如果它类似于训练行,那么就需要一个最大的相似输出。

行可以继续增加(因此get_dummies创建了许多列,使用这些列是不可行的),而且没有按优先级排序。要使ML模型工作,需要对Inp列的分类数据进行哪种编码。请提出一个更好的方式来模拟同样的。

EN

回答 1

Data Science用户

发布于 2022-05-06 04:42:14

您可以尝试使用其他编码器,如均值编码器、有序标记编码器、证据权重编码器、概率比编码器、二进制编码器。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/110500

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档