首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >多维层次聚类- python

多维层次聚类- python
EN

Stack Overflow用户
提问于 2016-06-28 15:46:54
回答 1查看 6.3K关注 0票数 3

有什么东西可以进行多维层次聚类吗?

我在这些地方看过:

  • http://docs.scipy.org/doc/scipy/reference/cluster.hierarchy.html
  • http://scikit-learn.org/stable/modules/clustering.html
  • http://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.hierarchy.dendrogram.html#scipy.cluster.hierarchy.dendrogram

但到目前为止还没有成功

意义:发现组的方式与二维相同,但具有多个维度。

一些代码:

代码语言:javascript
复制
import pandas as pd
import numpy as np
set_of_values = pd.DataFrame(
    [np.random.rand(10),
     np.random.rand(10),
     np.random.rand(10),
     np.random.rand(10),
     np.random.rand(10),],
     index=['temp differential', 'power differential', 'cost', 'time','output'],
    columns=range(10)).transpose()
print(set_of_values)

我想找到所有的集群(‘温差’,‘功率差异’,‘成本’,‘时间’,‘输出’)。不是图形化的,因为它是一个超平面。理想情况下,输出与所有组相同。

代码语言:javascript
复制
GROUP #1: (a,b,c,d,e), (a',b',c',d',e'), ... , (a'',b'',c'',d'',e'') 
...
GROUP #n: ('a,'b,'c,'d,'e), ('a,'b,'c,'d,'e), ... , (''a,''b,''c,''d,''e) 

给出一个逐步“聚类”的阈值。是可行的吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-06-28 16:55:37

下面是一个简单的例子。这里,用分层聚类对4个随机变量进行聚类:

代码语言:javascript
复制
%matplotlib inline
import matplotlib.pylab as plt
import seaborn as sns
import pandas as pd
import numpy as np

df = pd.DataFrame({"col" + str(num): np.random.randn(50) for num in range(1,5)})
sns.clustermap(df)

如果您关心的是了解树状图的联系和阈值获得集群,海运工具使用的枕木和this post将是有帮助的。

如果您想在空间中可视化这一点,我建议使用主成分分析并绘制PC1和PC2 iris.html

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38080769

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档