我正在尝试在一个非常大的数据集上训练一个线性模型。特征空间很小,但是有太多的样本无法保存在内存中。我在动态计算Gram矩阵,并试图将其作为参数传递给sklearn Lasso (或其他算法),但是,当我调用fit时,它需要实际的x和y矩阵。
你知道如何在不存储原始矩阵的情况下使用“预计算”功能吗?
发布于 2015-01-19 20:12:49
(我的答案是基于svm.SVC的用法,套索可能会有所不同。)
我认为你应该把Gram矩阵而不是X传递给fit方法。
此外,Gram矩阵具有形状(n_samples,n_samples),因此对于您的情况来说,它也应该太大而无法存储,对吧?
https://stackoverflow.com/questions/28024191
复制相似问题