文章/答案/技术大牛

发布

社区首页 >问答首页 >用于欺诈检测的特征工程

问用于欺诈检测的特征工程
EN

Stack Overflow用户

提问于 2018-05-14 20:50:07

回答 1查看 454关注 0票数 1

出于学术目的，我正在做一些关于欺诈检测的研究。我想具体了解有关从事务性数据集中进行特征选择\生成的技术。更详细地说，给定交易的数据集(例如信用卡)，选择在模型上使用哪些类型的功能，以及它们是如何设计的？

我遇到的所有论文都集中在模型本身(SVM，NN，...)没有真正涉及到这个话题。

此外，如果有人知道未匿名的公共数据集-这也会有所帮助。

谢谢

machine-learning

feature-selection

fraud-prevention

feature-engineering

回答 1

Stack Overflow用户

发布于 2018-05-14 22:20:07

对于数据科学家或机器学习从业者来说，对特征选择/排名有很好的理解可能是一笔巨大的财富。对这些方法的良好掌握有助于更好地执行模型，更好地理解数据的底层结构和特征，并导致对许多机器学习模型背后的算法有更好的直觉。

通常使用特征选择有两个原因: 1。减少特征的数量，减少过拟合，提高模型的泛化能力。2.更好地理解特征及其与响应变量的关系。

可能的方法：

单变量特征选择：

基于最大信息系数和最大信息系数的排名基于Correlation

Mutual correlation

Model

基于树的方法：

随机森林特征重要性(平均减少杂质，平均减少精度)

Other

稳定性selection
RFE

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50330778

复制

相似问题

问用于欺诈检测的特征工程
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于欺诈检测的特征工程EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于欺诈检测的特征工程
EN