对于非常大的稀疏向量,计算距离/邻近矩阵的最佳方法是什么?例如,您将得到以下设计矩阵,其中每行为68771维稀疏向量。
designMatrix <5830x68771型稀疏矩阵与压缩稀疏行format>
中存储的1229041个元素
发布于 2011-03-18 15:05:57
你试过scipy.spatial.distance中的例程了吗
http://docs.scipy.org/doc/scipy/reference/spatial.distance.html
如果这迫使你去一个密集的表示,那么你可能会更好地滚动你自己,这取决于非零元素的密度。您可以在新索引和原始索引之间保留一个映射,计算剩余的非零元素的成对距离,然后使用索引将事物映射回来。
https://stackoverflow.com/questions/5353708
复制相似问题