首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏炼丹笔记

    漫谈特征缩放

    作者: 时晴 说起"炼丹"最耗时的几件事,首先就能想到的就是数据清洗,特征工程,还有调参.特征工程真的是老生常谈了,但是特征工程又是最重要的一环,这一步做不好怎么调参也没用.在特征工程中,做特征缩放是非常重要的 ,如下图所示: 我们可以看到,在没做特征缩放前,用kmeans跑出的聚类结果就如图所示,以y=0为分界线,上面是一类,下面是一类,相当的离谱.主要原因就是y值的取值范围很大,从-4000~4000,而 Scaling的目的很简单,一方面是使得每列特征“范围”更接近,另一方面是让计算变得更加简单,如梯度下降在特征缩放后,将缩放的更快,效果更好,所以对于线性回归,逻辑回归,NN都需要做特征缩放: 特征缩放有很多种 ,具体是减去中位数再除以第3分位数和第一分位数之间的差值.如下所示: 因为该缩放方法用了分位点的差值,所以它降低了异常值的影响,如果你发现数据有异常值,并且懒得去修正它们,就用这种缩放方法吧.我们对比下异常值对 我们很容易发现StandardScaler使得异常值更接近均值了,但是在RobustScaler后,异常值还是显得比较异常. 3、MinMaxScaler from sklearn.preprocessing

    1.4K30发布于 2021-09-02
  • 来自专栏AI 算法笔记

    特征工程之特征缩放&特征编码

    (上) 特征工程之数据预处理(下) 本篇文章会继续介绍特征工程的内容,这次会介绍特征缩放特征编码,前者主要是归一化和正则化,用于消除量纲关系的影响,后者包括了序号编码、独热编码等,主要是处理类别型、文本型以及连续型特征 ---- 3.2 特征缩放 特征缩放主要分为两种方法,归一化和正则化。 3.2.1 归一化 归一化(Normalization),也称为标准化,这里不仅仅是对特征,实际上对于原始数据也可以进行归一化处理,它是将特征(或者数据)都缩放到一个指定的大致相同的数值区间内。 3.2.2 正则化 1.正则化是将样本或者特征的某个范数(如 L1、L2 范数)缩放到单位 1。 假设数据集为: ? 对样本首先计算 Lp 范数,得到: ? ---- 小结 特征缩放是非常常用的方法,特别是归一化处理特征数据,对于利用梯度下降来训练学习模型参数的算法,有助于提高训练收敛的速度;而特征编码,特别是独热编码,也常用于对结构化数据的数据预处理。

    1.7K20发布于 2019-08-16
  • 来自专栏SuperFeng

    机器学习系列 5:特征缩放

    肯定不能用手盘呀,这里就要用到特征缩放(Feature Scaling)。将变量 x1 和 x2 都缩放到一个范围中,我们将他们都缩放到 -1 到 1 这个范围内。 现在变量 x1 和 x2 的范围全部都在 -1 到 1 这个区间了,但是又出现一个问题,你发没发现,现在经过处理之后的数据全是正值,不分散,那么我们就要用稍微复杂一点的方法进行特征缩放

    58820发布于 2019-09-26
  • 来自专栏数据结构和算法

    Scikit-Learn 中级教程——特征缩放

    Python Scikit-Learn 中级教程:特征缩放 在机器学习中,特征缩放是一个重要的预处理步骤。它用于调整数据中特征的范围,以便模型能够更好地收敛和表现。 在本篇博客中,我们将深入介绍 Scikit-Learn 中的特征缩放方法,并通过代码示例说明如何进行特征缩放。 1. 为什么需要特征缩放? 在许多机器学习算法中,特征的尺度对算法的性能有着重要的影响。 常见的特征缩放方法 2.1 Min-Max 缩放 Min-Max 缩放是一种线性缩放方法,将特征缩放到指定的范围,通常是 [0, 1]。 = scaler.fit_transform(data) print("原始数据:\n", data) print("Z-Score 标准化后的数据:\n", standardized_data) 3. 特征缩放的注意事项 在进行特征缩放时,需要注意以下几点: 只对训练集进行缩放: 在训练和测试集的划分后,特征缩放应该只在训练集上进行。然后,使用同样的缩放参数对测试集进行缩放,以保持一致性。

    57710编辑于 2024-01-21
  • 来自专栏机器学习AI算法工程

    特征工程(三):特征缩放,从词袋到 TF-IDF

    因此,它是特征缩放的一个例子,这是第2章介绍的一个概念。特征缩放在实践中效果有多好? 我们来比较简单文本分类任务中缩放和未缩放特征的表现。 coding时间到! 所以我们需要只需要3特征集合:词袋,tf-idf,以及逐词进行L2归一化后的词袋。 在这个例子中,我们将使用Scikit-learn的CountVectorizer将评论文本转化为词袋。 测试集上进行特征缩放 特征缩放的一个细微之处是它需要了解我们在实践中很可能不知道的特征统计,例如均值,方差,文档频率,L2范数等。 通过对输入特征的加权组合,输入到一个sigmoid函数。sigmoid函数将任何实数平滑的映射到介于0和1之间。如图4-3绘制sigmoid函数曲线。 图3-1显示了一个向量形式的词袋向量,图4-1显示了特征空间中的四个词袋向量。 要形成文档词汇矩阵,只需将文档向量取出,平放,然后将它们堆叠在一起。 这些列表示词汇表中所有可能的单词。

    1.7K20发布于 2019-10-28
  • 来自专栏DeepHub IMBA

    特征工程中的缩放和编码的方法总结

    特征工程又是数据预处理的一个重要组成, 最常见的特征工程有以下一些方法: 编码 缩放 转换 离散化 分离 等等 在本文中主要介绍特征缩放特征编码的主要方法。 特征缩放 特征缩放是一种在固定范围内对数据中存在的独立特征进行标准化的技术。 对于这些模型来说,特性缩放是非常重要的,特别是当特性的范围非常不同的时候。范围较大的特征对距离计算的影响较大。 虽然是这么说,但是使用那种缩放来处理数据还需要实际的验证,在实践中可以用原始数据拟合模型,然后进行标准化和规范化并进行比较,那个表现好就是用那个,下图是需要使用特征缩放的算法列表: 特征编码 上面我们已经介绍了针对数值变量的特征缩放 了解了上面的类型后,我们开始进行特征编码的介绍: 独热编码(ONE HOT) 我们有一个包含3个分类变量的列,那么将在一个热编码中为一个分类变量创建每个热量编码3列。 独热编码又称一位有效编码。

    1.6K10编辑于 2022-11-11
  • 来自专栏韩曙亮的移动开发专栏

    【CSS3】CSS3 2D 转换 - scale 缩放 ② ( 使用 scale 设置缩放代码示例 - 图片缩放示例 )

    "IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>CSS3 2D 转换 - scale 缩放</title> <style> div { /* 设置浮动 令 div 从左到右排列 */ float

    90630编辑于 2023-10-11
  • 来自专栏算法channel

    北大陈浩然笔记:特征缩放和泛化能力(亮点)

    2特征缩放 由于 x 具有很多维的特征,每一维的特征大小可能相差甚多,这样会大大影响学习的速度。 为了避免这种情况,我们使用了特征缩放将每个特征的值进行处理,使之在[-1,1]之间,当然,原本范围就于此在一个数量级的特征,也可以不进行处理。处理公式如下: ? 或者 ? 其中 σ 为数据标准差。 3正规方程法 对于多元线性回归而言,正规方程法是一种准确的方法,就像最小二乘法对于单变量线性回归一样。 为了使形式更加简化,我们做以下符号设定 ? 由此,我们可以将S写成另一种形式,定义如下 ? 该方法得到了为准确值,即在我们给定条件下的最优解,但是该方法有两个弊端: 需要计算,相对于矩阵规模n而言,算法复杂度是O(n^3), n非常大时, 计算非常慢,甚至根本无法完成。 我们使用了冗余的特征,例如我们选取的两个特征始终保持倍数关系,则这两个特征向量线性相关。此时应该去除冗余的向量。 我们使用了太多的特征(特征的数量超过了样本的数量).

    1.1K00发布于 2018-07-31
  • 来自专栏Unity3d程序开发

    unity3d粒子缩放

    面板中Scale Multiplier填入倍数,例如0.5即是缩小一倍,大于1即是放大

    38620编辑于 2023-08-24
  • 来自专栏AI派

    如果你还不清楚特征缩放&特征编码的作用,不妨看看这篇文章

    本文来自星球朋友的投稿,如果觉得文章对你有帮助,可以去看看他的公众号: 机器学习与计算机视觉 如果你你正在学习机器学习,那么特征工程必不可少,特征缩放特征编码刚是其中的一项,如果你之前不了解,那么希望这边文章能对你有所启发 关于特征缩放特征编码,前者主要是归一化和正则化,用于消除量纲关系的影响,后者包括了序号编码、独热编码等,主要是处理类别型、文本型以及连续型特征。 ---- 3.2 特征缩放 特征缩放主要分为两种方法,归一化和正则化。 3.2.1 归一化 归一化(Normalization),也称为标准化,这里不仅仅是对特征,实际上对于原始数据也可以进行归一化处理,它是将特征(或者数据)都缩放到一个指定的大致相同的数值区间内。 3.通常如果使用二次型(如点积)或者其他核方法计算两个样本之间的相似性时,该方法会很有用。

    2.4K20发布于 2019-05-05
  • 来自专栏DeepHub IMBA

    机器学习特征工程:缩放、编码、聚合、嵌入与自动化

    好模型的秘诀不在于更花哨的算法,而在于更好的特征。 第1部分:数值 特征 1、1 缩放 多数机器学习算法对尺度敏感。 常用的三种缩放器各有适用场景:StandardScaler适合近似正态分布的数据,也是最常见的选择;MinMaxScaler将值压缩到0和1之间,适合神经网络;RobustScaler基于中位数和四分位距 sklearn.preprocessing import RobustScaler df['salary_scaled'] = RobustScaler().fit_transform(df[['salary']]) ⚠️ 缩放器只能在训练集上拟合 2、3 目标编码 用对应分组的目标变量均值替换每个类别值,处理高基数列时收效明显。 33 工作日历特征 import holidays indian_holidays = holidays.India(years=2025) df['is_holiday']

    10510编辑于 2026-04-15
  • 来自专栏人工智能

    机器学习(六)——线性回归的多变量、特征缩放、标准方程法

    机器学习(六) ——线性回归的多变量、特征缩放、标准方程法 (原创内容,转载请注明来源,谢谢) 一、多变量 当有n个特征值,m个变量时,h(x)=θ0+θ1x1+θ2x2…+θnxn,其中可以认为x0= 二、特征缩放(FeatureScaling) 特征缩放的目的,是为了让每个特征值在数量上更加接近,使得每个特征值的变化的影响相对比较“公平”。 当θ用公式进行迭代,两次迭代之间的Δθ的值小于某个值(一般可以用10-3),则可以认为代价函数已经最小。 由于这个方法是直接通过代数的方式,解出每个θ,因此,其不需要进行特征缩放,也不需要学习速率α。 2、特殊情况 由于用标准方程法时,涉及到要计算矩阵XTX的逆矩阵。但是XTX的结果有可能不可逆。 缺点:需要调试出合适的学习速率α、需要多次迭代、特征值数量级不一致时需要特征缩放。 2)标准方程法 优点:不需要α、不需要迭代、不需要特征缩放,直接解出结果。

    1.2K81发布于 2018-01-08
  • 来自专栏决胜机器学习

    机器学习(六) ——线性回归的多变量、特征缩放、标准方程法

    机器学习(六)——线性回归的多变量、特征缩放、标准方程法 (原创内容,转载请注明来源,谢谢) 一、多变量 当有n个特征值,m个变量时,h(x)=θ0+θ1x1+θ2x2…+θnxn,其中可以认为x0 二、特征缩放(FeatureScaling) 特征缩放的目的,是为了让每个特征值在数量上更加接近,使得每个特征值的变化的影响相对比较“公平”。 当θ用公式进行迭代,两次迭代之间的Δθ的值小于某个值(一般可以用10-3),则可以认为代价函数已经最小。 由于这个方法是直接通过代数的方式,解出每个θ,因此,其不需要进行特征缩放,也不需要学习速率α。 2、特殊情况 由于用标准方程法时,涉及到要计算矩阵XTX的逆矩阵。但是XTX的结果有可能不可逆。 缺点:需要调试出合适的学习速率α、需要多次迭代、特征值数量级不一致时需要特征缩放。 2)标准方程法 优点:不需要α、不需要迭代、不需要特征缩放,直接解出结果。

    1.3K60发布于 2018-03-07
  • 来自专栏韩曙亮的移动开发专栏

    【CSS3】CSS3 2D 转换 - scale 缩放 ① ( 使用 scale 设置缩放 | 使用 scale 设置缩放 与 直接设置盒子模型大小 对比 )

    一、使用 scale 设置缩放 在 CSS3 中的 2D 转换 中 , 可以使用 scale 样式 , 设置 盒子模型 的缩放属性 , 可以设置 放大 和 缩小 ; scale 样式语法 : transform 与 直接设置盒子模型大小 对比 使用 transform:scale 可以设置 盒子模型 的 缩放倍数 ; 直接修改 盒子模型 大小 , 也可以实现上述相同的功能 ; 直接 修改 盒子模型 大小 , ; 使用 transform:scale 设置缩放 , 可以任意设置 缩放的方向 , 不会影响 其它 盒子模型的布局 ; 三、代码示例 ---- 1、代码示例 - 设置两个参数代表宽高缩放 代码示例 "IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>CSS3 "IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>CSS3

    4.2K10编辑于 2023-10-11
  • 来自专栏python3

    python3-特征值,特征分解,SVD

    1.设A为n阶矩阵,若存在常数λ及n维非零向量x,使得Ax=λx,则称λ是矩阵A的特征值,x是A属于特征值λ的特征向量。 A的所有特征值的全体,叫做A的谱,记为λ(A) 2.特征分解(Eigendecomposition),又称谱分解(Spectral decomposition)是将矩阵分解为由其特征值和特征向量表示的矩阵之积的方法 其中Q是这个矩阵A的特征向量组成的矩阵,Σ是一个对角阵,每个对角线上的元素就是一个特征值。这里需要注意只有可对角化矩阵才可以作特征分解。 特征值分解是一个提取矩阵特征很不错的方法,但是它只是对方阵而言的 ? ? ? ? ? ]])) print(x) print(np.linalg.det(x)) s,v,d=np.linalg.svd(x) print (f"{s}\n\n{v}\n\n{d}\n") [[1. 2. 3.

    1.8K21发布于 2020-01-06
  • 来自专栏韩曙亮的移动开发专栏

    【CSS3】CSS3 2D 转换 - scale 缩放 ③ ( 使用 scale 设置制作可缩放的按钮案例 )

    放在 li 列表项中 , 或者 直接使用 li 列表项作为 按钮 标签元素 ;

    • 1
    • 2
    • 3< : 按钮 本身 设置 0.5 秒的动画持续时间 , 当鼠标移动到 按钮 上方之后 , 宽高缩放为 原来的 2 倍 ; /* 设置 动画 持续时间 .5s 相当于 0.5s */ transition: all .5s; li:hover { /* 宽高缩放为原来的 2 倍 */ transform 相当于 0.5s */ transition: all .5s; } li:hover { /* 宽高缩放为原来的 ; } </style> </head> <body>
      • 1
      • 2
      • 3<

    1.1K10编辑于 2023-10-11
  • 来自专栏前端开发随笔

    Vue3实现图片滚轮缩放和拖拽

    <template>

    </template> <script setup> import { ref } from 'vue' const url = ref("https://w.wallhaven.cc/

    3.2K30编辑于 2021-12-28
  • 来自专栏机器学习/数据可视化

    3特征分箱方法

    特征工程-特征分箱 一般在建立分类模型时,当我们进行特征工程的工作经常需要对连续型变量进行离散化的处理,也就是将连续型字段转成离散型字段。 特征离散化后,模型会更稳定,降低了模型过拟合的风险。 离散化的过程中连续型变量重新进行了编码,本文主要介绍是3种常见的特征分箱方法: 分箱特点 连续型变量执行离散化的分箱操作,能够更加简洁地呈现数据信息 消除特征变量的量纲影响,因为分箱之后都是类别数,例如 (quantiles)值以便具有相同填充的bins 聚类:kmeans 策略基于在每个特征上独立执行的k-means聚类过程定义bins。 In [12]: dis.bin_edges_ Out[12]: array([array([ 0., 42., 150.])], dtype=object) 分成3个类别 总共是10个元素,分成3 个类,10/3=3...1,前面两个3个元素,最后一个是4个元素,即最后一个箱体会包含余数部分的元素: In [13]: dis = KBinsDiscretizer(n_bins=3,

    1.1K30编辑于 2023-08-25
  • 来自专栏IMWeb前端团队

    摄像机、投影、3D旋转、缩放

    缩放原理:摄像机不动,被观察测物体不动,显示屏离摄像机越近,缩放比例越小,显示屏离摄像机越远,缩放比例越大。 投影分析 我们来看下面这张图: ? 因为,我们将显示屏和被观测物体共用一个坐标系,所以,我们可以计算出点(x1,y1,z1)投影到显示屏上的点的缩放比例为: h / Math.abs(vidiconZ - z1) 所以投影后的坐标为: x (); } </script> 现在,我们看到了正方体正常的显示在画布当中,那么我们现在来用演示证明一下缩放原理 缩放原理:摄像机不动,被观察测物体不动,显示屏离摄像机越近,缩放比例越小 ,显示屏离摄像机越远,缩放比例越大。 演示 Your browser does not support the canvas element. ## 3D旋转 上面讲了摄像机,投影以及缩放的原理以及实现,下面看旋转。

    1.9K60发布于 2018-01-08
  • 来自专栏全栈程序员必看

    窗口动画缩放,过渡动画缩放,Animator时长缩放_关闭动画缩放好不好

    我们通常会使用它的四个子类AlphaAnimation、RotateAnimation、ScaleAnimation和TranslateAnimation,他们分别可以实现渐变动画、旋转动画、平移动画、缩放动画 功能,当然我们今天的主角就是缩放动画 ScaleAnimation。 X坐标类型 private int mPivotYType = ABSOLUTE; //缩放中心点的Y坐标类型 private float mPivotXValue = 0.0f; //缩放中心点的X坐标比例 :缩放中心点的X坐标比例 pivotYType:缩放中心点的Y坐标类型 pivotYValue:缩放中心点的Y坐标比例 public class Test{ private void test(){ //示例传参实现的是,以控件中心为缩放点,从1.0倍缩小到0.5倍,即原图的二分之一,不设置缩放点类型,默认坐标原点以控件为准 ScaleAnimation animation = new ScaleAnimation

    3.8K20编辑于 2022-11-19
领券