让我们假设我们有一个文档集合,并希望执行一些无监督的主题分割。
和往常一样,我们将执行一些预处理(包括标记化、重音去除、低胁迫、归一化等等),并将令牌列表转换为原始计数或tfidf向量。我们称之为矩阵M。
现在我们有了几种可能的方法来执行一些简单的单词主题切分:
我有两个问题:
提前感谢!
发布于 2018-08-16 17:22:51
https://datascience.stackexchange.com/questions/37037
相似问题