我要介绍这样的问题:
比方说,有些人有不同的能力/技能。这些能力/技能取决于环境:地板的性质、天气温度、风速。我想学习的能力/技能是个人考虑环境的速度。
正如你所知,速度取决于距离,不仅是因为公式distance/time unit,而且因为即使是Usain也不能再现100米和200米的相同速度,实际上他的平均速度随着距离的增加而减小,环境的变量作为常数。这就是为什么我不能仅仅用平均速度来总结它是否更适应。
因此,由于因素是可变的/做变化的,我想用边际效应隔离,并得出结论:地板的什么性质对这个人来说更好,什么距离更好(Usain不是为了耐力而做的)。要做到这一点,我想使用线性回归,这是更简单的衍生。
主要的问题是我的数据并不总是那么具有历史意义。这往往是因为以前的经验不超过5-6次.
所以,当我在高中时,有一条经验法则告诉我们,我们至少需要5分才能完成一个函数(用OLS)。知道我年纪大了,有了更多的经验,我怀疑这个小小的门槛。但我没有足够的经验去知道这个门槛到底是什么。你知不知道?
发布于 2020-02-17 13:43:53
有两个问题:
我建议你从绘制你的数据开始:可视化变量之间的关系应该告诉你线性回归是否是一个好的选择,看到你的观点有多分散应该告诉你是否有足够的实例。
https://datascience.stackexchange.com/questions/68189
复制相似问题