我有一个大约4000个元素的特征数组,从一个源中提取。在这个数组上,我从其他源中再提取了7个特征,现在基本上每个数据点都有一个4007个特征数组。我试图根据这个特征数组对这些数据点进行分类,基本上是用曼哈顿距离做一个1NN。
然而,由于我的数学真的很差,我不知道如何衡量这个,所以我的7个元素实际上可以在这方面有所帮助。感觉这4000个元素要重要得多,而在距离计算中,其他7个元素是微不足道的。
我也把这个输入给了一个神经网络,我想知道我是否也需要对一些东西进行预处理,还是只给输入神经元4007个元素呢?
我已经做了特性缩放,但我想这与我想问的问题无关。
发布于 2021-08-29 19:56:12
有监督机器学习的目标是自动学习特征权重来预测目标值。
如果你有目标值,你可以采用机器学习算法(例如,k近邻或神经网络)。
没有必要自己挑选权重,算法会为你做的。
https://datascience.stackexchange.com/questions/31640
复制相似问题