请通过我对LSI (机械工程背景)的理解来理解我:
在LSI中执行SVD之后,有3个矩阵:
U,S,V转座。
U将单词与主题进行比较,S是衡量每个特征强度的一种方法。将主题与文档进行比较。
U dot S dot Vt返回SVD之前的原始矩阵。没有做太多(没有)深度代数,似乎:
U dot S dot **Ut**返回一项一项的矩阵,该矩阵提供了两个术语之间的比较。也就是说,一个术语与其他术语的关系,是一种比较词而不是成分的DSM (设计结构矩阵)。我可能完全错了,但我尝试了一个样本数据集,结果似乎是有意义的。这可能只是偏见(我想让它起作用,所以我看到了我想要的)。我不能发布结果,因为文件是受保护的。
但我的问题是:这样做有意义吗?合乎逻辑?数学上的?
谢谢您有时间/回复。
发布于 2013-03-04 11:27:54
如果你想知道一个术语和另一个术语有什么关联,你可以直接计算。
(U点S)
这些术语由行向量表示。然后,可以通过应用距离函数(如欧几里得距离)来计算距离矩阵。一旦你通过计算所有向量之间的距离来建立距离矩阵,得到的矩阵应该是空对称的,所有距离都>0。如果距离是小的,那么它们是相关的,否则它们就不是。
https://stackoverflow.com/questions/14692407
复制相似问题