首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >fit_transform(X) vs fit_transform(X,y)

fit_transform(X) vs fit_transform(X,y)
EN

Stack Overflow用户
提问于 2021-07-31 14:36:25
回答 1查看 61关注 0票数 0

我正在使用minmax scaler来缩放X,Y数据。我看到一些人只是分别缩放x和y,如下所示:

代码语言:javascript
复制
from sklearn.preprocessing import MinMaxScaler
sc=MinMaxScaler()
X=dataset.iloc[:,0:13]
y=dataset.iloc[:,13].values
Xnorm=pd.DataFrame(data=sc.fit_transform(X))
yshape=pd.DataFrame(data=y.reshape(-1,1))
ynorm=pd.DataFrame(data=sc.fit_transform(yshape))

Xnorm.shape
(506, 13)

我想知道是否可以同时缩放x和y,如下所示

代码语言:javascript
复制
datanorm=pd.DataFrame(data=sc.fit_transform(X,y))
datanorm.shape
(506, 13)

但是,datanorm与ynorm完全相同,只有13列。我期望datanorm应该有14列,其中13列来自x,1列来自y。我的理解正确吗?谢谢你的帮助。

EN

回答 1

Stack Overflow用户

发布于 2021-08-17 08:28:00

因为在某些算法中,我们需要归一化/缩放特征(X),而不是标签(y)。那么为什么不申请标签呢?

在ML中重新思考下面的步骤。首先,我们选择一个模型来处理训练数据。其次,对数据进行训练,找出利用这些数据的最佳参数。第三,我们使用该估计器来预测(推断)来自测试特征(X_test示例)的输出(标签)。

因此,如果您规格化/缩放标签,您的模型(第二步中的参数)仅适用于规格化/缩放的标签。第三步的推理值将是低分。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68603063

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档