在稀疏矩阵上执行特征缩放和平均归一化是个好主意吗?我有一个70%稀疏的矩阵。通常,特征缩放和平均归一化提高了算法的性能,但在稀疏矩阵的情况下,它增加了大量的非零项。
发布于 2014-02-19 09:07:38
如果表示要稀疏是很重要的,例如,为了适应内存,那么不能意味着--在表示本身中进行正常化,不。它变得完全密集,并违背了目的。
通常,将平均归一化数学推入公式或计算的另一部分。或者,您可以在访问元素时进行规范化,之前计算了平均值和方差。
或者,如果可能的话,您可以选择一个不需要规范化的算法。
发布于 2019-07-05 01:37:19
如果使用scikit-学习,您可以如下所示:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler(with_mean=False)
scaler.fit(data)在这里,您可以在文档这里中看到保持稀疏性的意思。
https://stackoverflow.com/questions/21875518
复制相似问题