我正在使用minmax scaler来缩放X,Y数据。我看到一些人只是分别缩放x和y,如下所示:
from sklearn.preprocessing import MinMaxScaler
sc=MinMaxScaler()
X=dataset.iloc[:,0:13]
y=dataset.iloc[:,13].values
Xnorm=pd.DataFrame(data=sc.fit_transform(X))
yshape=pd.DataFrame(data=y.reshape(-1,1))
ynorm=pd.DataFrame(data=sc.fit_transform(yshape))
Xnorm.shape
(506, 13)我想知道是否可以同时缩放x和y,如下所示
datanorm=pd.DataFrame(data=sc.fit_transform(X,y))
datanorm.shape
(506, 13)但是,datanorm与ynorm完全相同,只有13列。我期望datanorm应该有14列,其中13列来自x,1列来自y。我的理解正确吗?谢谢你的帮助。
发布于 2021-08-17 08:28:00
因为在某些算法中,我们需要归一化/缩放特征(X),而不是标签(y)。那么为什么不申请标签呢?
在ML中重新思考下面的步骤。首先,我们选择一个模型来处理训练数据。其次,对数据进行训练,找出利用这些数据的最佳参数。第三,我们使用该估计器来预测(推断)来自测试特征(X_test示例)的输出(标签)。
因此,如果您规格化/缩放标签,您的模型(第二步中的参数)仅适用于规格化/缩放的标签。第三步的推理值将是低分。
https://stackoverflow.com/questions/68603063
复制相似问题