我是机器学习的新手,所以我在这里要求一个健全的检查,如果我问的问题是合理的。
我有一个列的数据集,所以我想用熊猫调用csv中的一个列。
从这列数字中取一个数字,做一些无监督的学习,以确定这个值是否是该列中的一个异常值,它是否属于该列。
下面的图表显示了我如何看待这一过程。我不知道在这种情况下,不受监督的方法最适合做些什么。

发布于 2020-01-23 16:04:16
几点意见/问题/考虑:
编辑:
在幕后,机器学习基本上是一组关于列和行子集的智能统计和决策。但是,只有一列,没有时间序列,没有什么明智的子集或决定。从本质上说,这是元素的一个特殊的Z分数。你必须决定你想要多少\sigma。
https://datascience.stackexchange.com/questions/66927
复制相似问题