如何创建SparseVector和密集向量表示
如果DenseVector为:
denseV = np.array([0., 3., 0., 4.])稀疏向量表示是什么?
发布于 2015-07-21 02:34:40
除非我完全误解了您的疑问,否则MLlib data type documentation非常清楚地说明了这一点:
import org.apache.spark.mllib.linalg.Vector;
import org.apache.spark.mllib.linalg.Vectors;
// Create a dense vector (1.0, 0.0, 3.0).
Vector dv = Vectors.dense(1.0, 0.0, 3.0);
// Create a sparse vector (1.0, 0.0, 3.0) by specifying its indices and values corresponding to nonzero entries.
Vector sv = Vectors.sparse(3, new int[] {0, 2}, new double[] {1.0, 3.0});其中,Vectors.sparse的第二个参数是索引的数组,第三个参数是这些索引中的实际值的数组。
发布于 2017-04-13 18:17:36
稀疏向量是当向量中有很多值为零时。而稠密向量是指向量中的大多数值都不为零。
如果必须从指定的密集向量创建稀疏向量,请使用以下语法:
import org.apache.spark.mllib.linalg.Vector;
import org.apache.spark.mllib.linalg.Vectors;
Vector sparseVector = Vectors.sparse(4, new int[] {1, 3}, new double[] {3.0, 4.0});https://stackoverflow.com/questions/31522893
复制相似问题