我有一个关于使用距离矩阵进行聚类的问题,但是很稀疏。
是否有不扩展矩阵的稀疏距离对象格式,并且可以使用稀疏表示?
目前,我正在做以下工作
# read sparse matrix
sparse <- readMM('sparse-matrix')
distance <- as.dist(sparse)稀疏矩阵已经是正确的距离矩阵,它对于未连接的条目具有NA。
>sparse
[1,] . . .
[2,] 1 . .
[3,] 1 . .
> as.dist(sparse)
1 2
2 1
3 1 0但是,使用as.dist将其转换为
asMethod(对象)中的错误:不允许负长度向量
大概是因为它把矩阵扩展成一个完整的形式。矩阵(NxN)大小为N= 49281,需要这种格式(dist对象),例如hclust方法
类似的问题没有任何答案在R帮助列表上
发布于 2013-04-09 19:55:34
距离矩阵是如何稀疏的?每两个物体之间都有一个距离,所以它实际上是一个非常密集的矩阵。然而,三角矩阵足以描述相互距离(如D = D')。实际上,dist生成的对象就是这种情况。
如果距离矩阵是稀疏的,因为很多对象是相同的,那么也许您只想在唯一的对象上计算距离矩阵。
https://stackoverflow.com/questions/15911022
复制相似问题