文章/答案/技术大牛

发布

社区首页 >问答首页 >在Python中实现元素级余弦相似度的最佳方法是什么？

问在Python中实现元素级余弦相似度的最佳方法是什么？
EN

Stack Overflow用户

提问于 2019-07-09 00:41:19

回答 2查看 719关注 0票数 1

对于较大的矩阵，下面的代码效率非常低。有没有更好的方法实现这一点？

我已经在网上搜索过这个here了。

import numpy as np

def cosine_similarity(x, y):
    return np.dot(x, y) / (np.sqrt(np.dot(x, x)) * np.sqrt(np.dot(y, y)))

def compare(a, b):

    c = np.zeros((a.shape[0], b.shape[0]))

    for i, ai in enumerate(a):
        for j, bj in enumerate(b):
            c[i, j] = cosine_similarity(ai, bj)

    return c

a = np.random.rand(100,2000)
b = np.random.rand(800,2000)

compare(a,b) # shape -> (100, 800)

python

cosine-similarity

回答 2

Stack Overflow用户

发布于 2019-07-09 01:40:06

在注释中，如果您想要取两个矩阵的乘积，那么numpy已经有了一个有效的实现，但对您来说可能太慢了(O(n^3))。

import numpy as np

a=np.array([3,2,1])
b=np.array([1,2,3])
c=a.dot(b)
print(c) #output = 10

我在评论中看到你对向量之间的余弦距离感兴趣。对于余弦相似性，请考虑使用Scipy：

from scipy.spatial.distance import cosine

a=[1,0,1]
b=[0,1,0]
print(cosine(a,b)) #output = 1.0

这可能会更快地满足您的需求。这是documentation。

票数 1

Stack Overflow用户

发布于 2019-07-09 02:18:29

个人编辑

为了有效地计算余弦相似度，下面是我写的一个解决方案：

def compare(a, b):
    x = np.atleast_2d(np.sqrt(np.sum(a*a, axis=1))).T
    y = np.atleast_2d(np.sqrt(np.sum(b*b, axis=1))).T
    return a.dot(b.T) / x.dot(y.T)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56939272

复制

相似问题

问在Python中实现元素级余弦相似度的最佳方法是什么？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在Python中实现元素级余弦相似度的最佳方法是什么？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在Python中实现元素级余弦相似度的最佳方法是什么？
EN