首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >特征工程技术清单

特征工程技术清单
EN

Data Science用户
提问于 2016-07-25 18:55:53
回答 2查看 17.6K关注 0票数 18

是否有任何资源与一系列的功能工程技术?数据类型、模型和特征工程技术的映射将成为金矿。

EN

回答 2

Data Science用户

发布于 2019-07-15 15:20:04

缺失的数据估算:

  1. 完整案例分析
  2. 平均/中值/模式估算
  3. 随机样本估算
  4. 用任意值替换
  5. 缺失值指示器
  6. 多元归算

分类编码:

  1. 一次热编码
  2. 计数和频率编码
  3. 目标编码/平均编码
  4. 序数编码
  5. 证据权重
  6. 稀有标签编码
  7. BaseN、特性散列和其他

变量转换:

  1. 对数
  2. 互惠性
  3. 平方根
  4. 指数型
  5. 叶强生
  6. 箱-考克斯

消散:

  1. 等频离散
  2. 等长离散化
  3. 树木凋零
  4. ChiMerge离散化

离群点清除:

  1. 移除异常值
  2. 将异常值处理为NaN
  3. 封顶,温湿度

功能缩放:

  1. 标准化
  2. MinMax标度
  3. 平均标度
  4. 最大绝对标度
  5. 单位范数

日期和时间工程:

  1. 提取天数、月份、年份、季度、过去的时间

特征创建:

  1. 求和,减法,均值,最小,最大,乘积,特征群商

汇总交易数据:

  1. 与上述相同,但在时间窗口中具有相同的功能

从文本中提取特征:

  1. 一袋袋话
  2. 特菲夫
  3. N克
  4. word2vec
  5. 主题提取

最后从图像中提取特征。

一篇很好的文章描述了以上大多数技术:特征工程--一个综合概述

学习有关特性工程的更多资源的好列表:学习特性工程的最佳资源

特性工程的Python可以在这条线中找到

免责声明:我写了这两篇文章,同时也是推荐的一门课程的创建者。

票数 13
EN

Data Science用户

发布于 2016-07-26 11:05:06

关于如何进行特征工程,没有明确的来源。它往往取决于你想要解决的问题。有人说这是一门艺术,而不是科学。

但是如果可以的话,我会经历一些高得分的卡格勒内核/获胜的解决方案。直接去卡格尔,浏览一下比赛。里面有很多非常有用的材料。

此外,“机器学习研究”杂志还发表了大量关于特征工程的论文。只要在他们的网站http://www.jmlr.org/上搜索即可。

下面的链接是有用的,可以用很长的话来解释:

  • 有关特性工程的一些最佳实践的一些信息可以在Quora上找到,请参阅此链接
  • 在机器学习掌握方面,有关于特征工程的此页
票数 10
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/12984

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档