文章/答案/技术大牛

发布

社区首页 >问答首页 >如何按特定一天的时间进行聚类

问如何按特定一天的时间进行聚类
EN

Stack Overflow用户

提问于 2014-05-25 06:51:07

回答 1查看 621关注 0票数 0

我有银行到达人数的日志，每半个小时一次，为期一个月。

我试图根据“到达”的数量找到不同的集群组。我试了一天，我试了一小时(不是特定的一天)。我想根据某一天的具体时间试一试。

举个例子：

星期四的14:00和周日的15:00是一个集群，平均有10000人到达。
星期一在13:00，星期一在10:00，星期二在16:00是一个集群，平均15000到达。
其余都是另一个集群，平均到达人数为2000人。

我有一个csv文件，列有：Date，Day(1-7)，Time，Arrivals

直到现在我才用这个：

km <- kmeans(table, 3, 15)
plot(km)

(我尝试了3个集群)-这个代码集群对。(一个3x3的矩阵，图中每3列中有2列)

有办法吗？

cluster-analysis

k-means

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-05-25 15:51:29

K-均值和类似的算法将对这类数据产生毫无意义的结果。

问题是，您在错误的数据上使用了错误的工具来处理错误的问题。

您的数据是：Date, Day(1-7), Time, Arrivals

K-均值将尝试最小化方差.但是，方差对这个数据集有任何意义吗？你怎么知道k最有意义？因为Arrivals可能是这些属性中变化最大的，所以它将完全控制您的结果。

首先你应该试着回答的问题是：，什么是好结果，？然后，考虑将结果可视化的方法，以验证您是否在做某事。当您将数据可视化后，考虑如何在可视化上手动标记所需的结果，这可能对您来说已经足够了。比祈祷k-意味着产生一些有意义的结果更好；因为在这种混合类型的数据上，它通常不能很好地工作。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/23852799

复制

相似问题

问如何按特定一天的时间进行聚类
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何按特定一天的时间进行聚类EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何按特定一天的时间进行聚类
EN