首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何按特定一天的时间进行聚类

如何按特定一天的时间进行聚类
EN

Stack Overflow用户
提问于 2014-05-25 06:51:07
回答 1查看 621关注 0票数 0

我有银行到达人数的日志,每半个小时一次,为期一个月。

我试图根据“到达”的数量找到不同的集群组。我试了一天,我试了一小时(不是特定的一天)。我想根据某一天的具体时间试一试。

举个例子:

  • 星期四的14:00和周日的15:00是一个集群,平均有10000人到达。
  • 星期一在13:00,星期一在10:00,星期二在16:00是一个集群,平均15000到达。
  • 其余都是另一个集群,平均到达人数为2000人。

我有一个csv文件,列有:DateDay(1-7),TimeArrivals

直到现在我才用这个:

代码语言:javascript
复制
km <- kmeans(table, 3, 15)
plot(km)

(我尝试了3个集群)-这个代码集群。(一个3x3的矩阵,图中每3列中有2列)

有办法吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-05-25 15:51:29

K-均值和类似的算法将对这类数据产生毫无意义的结果。

问题是,您在错误的数据上使用了错误的工具来处理错误的问题。

您的数据是:Date, Day(1-7), Time, Arrivals

K-均值将尝试最小化方差.但是,方差对这个数据集有任何意义吗?你怎么知道k最有意义?因为Arrivals可能是这些属性中变化最大的,所以它将完全控制您的结果。

首先你应该试着回答的问题是:,什么是好结果,?然后,考虑将结果可视化的方法,以验证您是否在做某事。当您将数据可视化后,考虑如何在可视化上手动标记所需的结果,这可能对您来说已经足够了。比祈祷k-意味着产生一些有意义的结果更好;因为在这种混合类型的数据上,它通常不能很好地工作。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23852799

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档