首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >tabpy连接问题[tableau & python]

tabpy连接问题[tableau & python]
EN

Stack Overflow用户
提问于 2017-08-07 23:27:03
回答 2查看 289关注 0票数 0

我在使用tabpy时遇到了这个问题。我使用示例超级存储数据集,并希望使用sum(利润)和sum(Sales)对子类别进行聚类,但它返回错误:

ValueError : n_samples=1应该是>= n_clusters=2。

这是我的剧本:

代码语言:javascript
复制
SCRIPT_str("
    from sklearn.cluster import KMeans
    kmeans = KMeans(n_clusters=2)
    tmp=[]
    for i in range(len(_arg1)):   
        tmp.extend([[_arg1[i],_arg2[i]]]) 
    KMmodel = kmeans.fit(tmp)
    labels = KMmodel.labels_
    return labels", 
sum([Profit]),sum([Sales]))
EN

回答 2

Stack Overflow用户

发布于 2017-10-01 16:05:04

尝试将N-群集选项更改为1并检查

票数 0
EN

Stack Overflow用户

发布于 2018-02-23 20:14:18

您可以使用numpy column_stack并使用子类别进行计算。

代码语言:javascript
复制
SCRIPT_INT(
"
import numpy as np
from sklearn.cluster import KMeans
X = np.column_stack([_arg1,_arg2])

kmeans = KMeans(n_clusters=2).fit(X)
return kmeans.labels_.tolist()
", SUM([Profit]),SUM([Sales])
)

以下是我的研究结果:

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45557078

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档