我有一个数据集:

我被问到:定义一个度量和相应的函数,以确定在过去一年中,在积极的客户参与方面,谁是增长最快的用户。根据定义“增长最快的用户”的指标报告前10名用户。
到目前为止,我已经创建了一个相关矩阵:
user_id content_count total_engagement date_Delta
user_id 1.000000 -0.056683 0.027150 -0.000014
content_count -0.056683 1.000000 0.215149 -0.007097
total_engagement 0.027150 0.215149 1.000000 0.002337
date_Delta -0.000014 -0.007097 0.002337 1.000000如您所见,content_count和total_engagement具有最好的相关性组件。
接下来,我想做的是创建每个user_id及其total_engagement的图表,以查看总体线性度,这将显示哪些用户的total_engagement有很强的增长。
不过,总的来说,我对如何为提出的问题定义一个度量标准感到有点困惑。我想我只是想写这篇文章,看看我能不能让别人想出一些想法。
发布于 2018-10-17 05:56:41
你必须有新的领域,这将告诉user_id的日常工作。类似的东西,总管理/日期_德尔塔,这将提供实际的日订婚。
https://stackoverflow.com/questions/52847132
复制相似问题