文章/答案/技术大牛

发布

社区首页 >问答首页 >KMeans聚类帮助标注多类监督模型

问KMeans聚类帮助标注多类监督模型
EN

Data Science用户

提问于 2017-01-18 19:54:04

回答 1查看 1.4K关注 0票数 -1

编辑:能够使用KMeans聚类算法来帮助将数据标注到受监督的模型中，这是公认的做法吗？(无监督-饲料->监督)？

原因是，重新标注数百万条记录是不可能的，这是一个阶级不平衡的问题，历史上的少数民族阶级是非常有用的。

我觉得这是一个强化学习的问题，但对它还不太了解，说不出来。

如果没有上述任何一个，对于不平衡的欺诈检测模型来说，什么是好的方法？精确和召回是比精确性更好的衡量标准。

clustering

scikit-learn

k-means

回答 1

Data Science用户

回答已采纳

发布于 2017-01-19 08:15:06

K-意思是不会给你贴标签的。

聚类不是分类。

这是个很难解决的问题。大多数情况下，你会得到不好的结果！

因此，与其尝试自动化，不如使用集群来理解您的数据。尝试推导出一些规则来识别例如不同类型的欺诈。但千万不要假设集群都是好的(因为它们从来都不是好的)。

票数 3

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/16389

复制

相似问题

问KMeans聚类帮助标注多类监督模型
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问KMeans聚类帮助标注多类监督模型EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问KMeans聚类帮助标注多类监督模型
EN