这可能是一个普遍的问题,但我认为这可能是最好的地方集思广益。如果我有一个视频网站,只想保留视频点播一定的时间,然后摆脱它们,以最大限度地提高运营成本,我会考虑或使用什么样的数据度量/方法来决定时间?
就像一个典型的网站,视频可以跟踪观看,追随者等,而交易可能是在观看/运营成本。
发布于 2018-08-30 04:59:06
在这里,集群可以是一个理想的选择。从问题上看,数据很可能是连续格式的。本质上,聚类是一种查找相似对象组的方法。物体之间的相似性取决于所使用的距离度量的类型。在这种背景下,你可以从找到人们最喜欢或最不喜欢的视频开始。像相互信息增益这样的测量是有帮助的。
https://datascience.stackexchange.com/questions/37533
复制相似问题