首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在特性工程期间,在规范化数据集之前使用数据集的zscore的利弊?

在特性工程期间,在规范化数据集之前使用数据集的zscore的利弊?
EN

Data Science用户
提问于 2019-04-04 02:38:45
回答 2查看 5.9K关注 0票数 0

规范化是一种常见的特征工程技术。但是,在对数据集进行规范化之前,此帖子在数据集中使用了标准化(Zscore)。

我认为这会导致数据中的一些信息丢失。

这样做的利弊是什么?

EN

回答 2

Data Science用户

发布于 2019-04-04 07:36:06

规范已经标准化的数据集不应更改任何内容,除非出于某种原因使用了不同的规范化方案。

票数 2
EN

Data Science用户

发布于 2019-04-04 05:47:04

Z-分数正常化是一种将测试结果与“正常”人群进行比较的方法,并使他们达到相同的可比较尺度。因此,ZScore的优势可以是:

z\_score = \frac{x-\bar x}{\sigma}

Z分数正常化有以下优点:

  1. Z分数可以用来比较来自不同测试的原始分数。
  2. Z分数考虑了一组原始分数的平均值和可变性。

Z评分的缺点是:

  1. Z分数总是呈正态分布。
  2. 如果数据是倾斜的,则原点线的左右分布不相等。
票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/48562

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档