我在用create_dendrogram在plotly.figure_factory中绘制树状图时遇到了一些困难。
默认的链接乐趣(linkagefun)是complete,而距离函数(distfun)的默认设置是scs.distance.pdist。
但是我想要的设置是jaccard表示distfun,average表示linkagefun:我想要的设置如下:
import pandas as pd
import numpy as np
from scipy.spatial.distance import pdist
import matplotlib.pyplot as plt
import scipy.cluster.hierarchy as such
plt.figure(figsize = (10, 10))
disMat = sch.distance.pdist(df, metric='jaccard')
disMat1 = sch.distance.squareform(disMat)
Z=sch.linkage(disMat1,method='average')
Dend=sch.dendrogram(Z,orientation='right')
plt.tick_params(
axis='y',
which='both',
direction='in',
left=False,
right=False,
labelleft=False)我注意到linkagefun可以由linkagefun=lambda x: sch.linkage(x, 'average')设置,但是distfun不能由distfun='jaccard'设置,我不知道如何设置这个函数。
fig = create_dendrogram(df, orientation='left',
labels=df.index,
distfun='jaccard',
linkagefun=lambda x: sch.linkage(x, 'average'))
fig.show()下面是df集的示例:
import pandas as pd
df = pd.DataFrame({'1-7':[0,0,1,1,0,1,1],'1-2':[1,0,1,0,0,1,1],'2-3':[1,0,0,0,1,1,0],'2-2':[0,1,0,1,0,1,1],'1-1':[1,0,0,1,0,1,0],'1-3':[0,1,1,1,0,0,0],'1-5':[0,1,0,1,1,0,1]},index=['a','b','c','d','e','f','g'])因为我需要Dash来绘制网页上的图形,所以我似乎不得不巧妙地使用create_dendrogram。
发布于 2022-06-30 20:30:56
您可以使用partial从functools“冻结”指定距离度量的scipy.spatial.distance.pdist参数。
from functools import partial
from scipy.spatial.distance import pdist
pw_jaccard_func = partial(pdist, metric='jaccard')然后使用部分函数作为distfun的输入。
fig = create_dendrogram(df, orientation='left',
labels=df.index,
distfun=pw_jaccard_func ,
linkagefun=lambda x: sch.linkage(x, 'average'))https://stackoverflow.com/questions/71958887
复制相似问题