文章/答案/技术大牛

发布

社区首页 >问答首页 >正负标准化

问正负标准化
EN

Data Science用户

提问于 2020-06-25 14:26:06

回答 2查看 710关注 0票数 -1

我有一个数据集，其中有几个列，例如：

总费用:平均数=3 000 000

完成百分比:平均= 50

最终利润%：平均数= 14

在拟合线性回归之前，我知道不同数量级的数据应该标准化(使用python和sklearn)。问题是，这些数据中有负面因素，我需要保留，所以我不知道应该使用哪种类型的标准化？我唯一熟悉的两种方法是日志转换和StandardScaler，我认为这两种方法都消除了负面影响。

python

preprocessing

回答 2

Data Science用户

发布于 2020-06-25 14:29:58

你可以使用正常化。归一化，你的平均值为0，标准差为1，包含正负两种值。

X_{Normalised} = \frac{X - \mu}{\sigma}

这里，\mu是您最初的平均值，\sigma是您的标准差。

票数 0

Data Science用户

发布于 2020-06-26 12:22:28

您仍然可以使用StandardScaler()，因为它将保留负值。如果您认为您有一些异常值，并且希望减少它们的影响，您还可以查看RobustScaler()。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/76663

复制

相似问题

问正负标准化
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问正负标准化EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问正负标准化
EN