首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏杨熹的专栏

    特征工程怎么做

    Discriminant Analysis,线性判别分析) 特征选择:从特征集合中挑选一组最具统计意义的特征子集,把无关的特征删掉,从而达到降维的效果 常用的方法: filter(刷选器)方法:Pearson相关系数,Gini-index

    2.2K30发布于 2018-04-02
  • 来自专栏小白技术社

    语义分析的一些方法(中篇)

    特征提取 Gini-index: 一个特征的Gini-index越大,特征区分度越高。

    1.6K10发布于 2020-07-09
  • 来自专栏AutoML(自动机器学习)

    【转载】机器学习之特征工程(有删改)

    如Pearson相关系数,Gini-index(基尼指数),IG(信息增益)等,下面举Pearson指数为例,它的计算方式如下: r2xy=(con(x,y)var(x)var(y)−−−−−−−−−−

    1.1K20发布于 2019-02-23
  • 来自专栏数据科学与人工智能

    【数据挖掘】文本挖掘:语义分析的一些方法

    图22.文献[45]训练数据获取流程图 特征提取 Gini-index: 一个特征的Gini-index越大,特征区分度越高。

    9.9K61发布于 2018-02-27
  • 来自专栏python前行者

    机器学习之(四)特征工程以及特征选择的工程方法

    如Pearson相关系数,Gini-index(基尼指数),IG(信息增益)等,下面举Pearson指数为例,它的计算方式如下: 其中,x属于X,X表一个特征的多个观测值,y表示这个特征观测值对应的类别列表

    1.5K20发布于 2019-08-18
  • 来自专栏机器学习AI算法工程

    文本挖掘:语义分析的一些方法

    图22.文献[45]训练数据获取流程图 特征提取 Gini-index: 一个特征的Gini-index越大,特征区分度越高。

    3.7K80发布于 2018-03-12
  • 来自专栏生信技能树

    irGSEA:基于秩次的单细胞基因集富集分析整合框架

    但Sargent 需要计算细胞间的gini-index后,将按gene-set-by-cell assignment score matrix转换为distribution of indexes。

    4.4K24编辑于 2023-12-05
领券