问K-均值可视化问题8
EN

Data Science用户

提问于 2019-02-19 22:09:02

回答 1查看 262关注 0票数 1

Hello正在寻找示例python for K-当我有超过6个feutres的数据集时。谢谢

python

data-mining

k-means

回答 1

Data Science用户

发布于 2019-02-20 11:00:42

你想做什么还不够清楚。如果我理解正确，你想要训练一个K-均值聚类，并可视化结果。但是，您的数据集中有8个维度，显然，您不能绘制这样的空间。

你能做的就是减少二维的维度，然后创建这个图。

例如,

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.decomposition import PCA
from sklearn.cluster import KMeans

# read my data with pandas into a dataframe
data = pd.read_csv("data.csv")

# run a KMeans model with 3 clusters. Change that number to what you want
clustering_kmeans = KMeans(n_clusters=3, precompute_distances="auto", n_jobs=-1)
clusters = clustering_kmeans.fit_predict(data)

# run PCA to reduce the dimensionality to 2 dimensions
reduced_data = PCA(n_components=2).fit_transform(data)

# create a new dataframe that contains the 2 dimensions and the cluster label
results = pd.DataFrame(reduced_data,columns=['pca1','pca2'])
results['label'] = clusters

# plot the results with a scatterplot
sns.scatterplot(x="pca1", y="pca2", hue=label, data=reduced_data)
plt.show()

票数 3

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/45839

复制

相似问题

问K-均值可视化问题8
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问K-均值可视化问题8EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问K-均值可视化问题8
EN