那么,文档-词矩阵是实现LDA的有效方法吗?我们能有其他更好的方法吗?我需要一些关于我的项目的建议,所以请帮助
发布于 2017-09-26 19:24:42
对于稀疏数据,您当然应该使用稀疏向量而不是密集向量。
而不是存储所有的零,你只保留非零的值。
一个典型的数据模型(请参阅文献中的替代品)是简单地使用一个元组列表(i,v),其中i是列索引,v是一个非零值。
https://stackoverflow.com/questions/46429206
相似问题