首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >无法将字符串转换为浮动:“曾傑瑞”

无法将字符串转换为浮动:“曾傑瑞”
EN

Stack Overflow用户
提问于 2022-08-18 00:53:58
回答 1查看 58关注 0票数 -2

我正在尝试构建一个决策树回归器模型,并且已经分割了训练和测试数据集。但是,一旦我试图将决策树辅助器安装到X_train和y_train中,我将收到以下错误:

“无法将字符串转换为浮动:‘曾傑瑞’”

我甚至尝试使用numpy将X_train数据转换为数组,也为索引创建了一个列,但仍然面临相同的问题。请帮忙。谢谢

EN

回答 1

Stack Overflow用户

发布于 2022-08-18 01:04:13

文档中,决策树是:

能够处理数字和分类数据。然而,scikit-learn实现目前不支持分类变量。

Scikit的树需要使用数字来表示类别。这是对它是如何在sklearn中实现的的限制,而不是对树本身的限制。

您可以使用LabelEncoder将分类特性转换为数字特性,但是.

如果测试集中可能没有表示类别的某些值,那么单热编码是一个更好的选择。

OHE的另一个(重要)优点是它不会在特性中强制执行顺序。也就是说,你不会遇到曾傑瑞> Joe > Ben这样的尴尬场景。这种人为的顺序可以通过您的模型来学习。

请注意,LabelEncoderOneHotEncoder都是变压器。所以他们有fit()fit_transform()transform()方法。与大多数转换器一样,典型的工作流程是对训练进行fit_transform,然后对测试进行转换。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73396341

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档