文章/答案/技术大牛

发布

社区首页 >问答首页 >如何计算k均值何时收敛于tf idf？

问如何计算k均值何时收敛于tf idf？
EN

Stack Overflow用户

提问于 2016-08-06 03:55:30

回答 1查看 268关注 0票数 0

我是一个使用文本数据的新手。

我有一个大约300,000个唯一产品名称的数据框架，我正在尝试使用k均值将相似的名称聚在一起。我使用sklearn的tfidfvectorizer将名称矢量化，并将其转换为tf-idf矩阵。

在我把它转换成一个稀疏矩阵后，我用5-10个簇来拟合k均值，但我不知道我是否收敛了。

我怎么才能解决这个问题呢？

convergence

python

scikit-learn

k-means

tf-idf

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-08-07 00:43:43

根据the source的说法，属性n_iter_应该包含k均值迭代次数。如果为n_iter_ < max_iter，则算法在给定的容差内收敛。

如果您要完成的任务是确定最佳集群数量，则可以使用带有inertia_属性的elbow method。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/38796898

复制

相似问题

问如何计算k均值何时收敛于tf idf？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何计算k均值何时收敛于tf idf？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何计算k均值何时收敛于tf idf？
EN