在这个问题上我需要一些提示。
我有一个电真皮活性读数的数据集,自然地,受被调查人的行动影响。然而,在同一数据集中,我也有可以用来“控制”数据的加速度计数据。这意味着,我希望,在看EDA读数时,我能以某种方式考虑到人的加速度计读数,并对其进行过滤/根据加速度计值中明显的姿态变化进行校正。
举个例子,图1。1显示在实验开始时峰值日珥较高的EDA (也称为电流皮肤反应,简称gsr)读数:

第二个图显示的是x、y和z方向的加速度计读数,显示出在峰值较高的这几个阶段中有更多的活动:

如何根据这些加速度计读数来控制我的EDA值?任何对文学或数学的暗示都将不胜感激。
提前感谢!
发布于 2020-10-05 08:55:31
简而言之,我认为您问题的重点主要是如何处理协变量(注意这个术语及其同义词的使用并不总是很清楚--参见这里和这里。我所说的协变量是“在统计学中,协变量代表了实验中没有被控制的变异源,并且被认为影响了因变量。”
如果我们首先后退一步,从分析中询问您真正想要的是什么,我的理解是研究两个(或更多)变量之间的关系。这一方面是EDA值,另一方面是一些输出变量,例如基于心跳数据的情绪状态(因为我在这一点上对你的结果变量(S)没有太多的信息,所以我只称它们为y)。因此,EDA值作为自变量,y作为因变量。到目前为止,在统计上把因变量和自变量很好地结合在一起的方法有很多种,从计算两个变量之间的相关性(假设它们都是数值变量)到拟合线性模型,再到机器学习技术等等。现在让我们开始建立一个线性模型:
短手表示法:y= EDA
同样的模型写得更详细:y=截取+ EDA +错误
你已经知道,然而,你有另外的外部影响影响你的EDA-价值观。幸运的是,您甚至试图通过加速度计来测量/量化这种影响。因此,除了你感兴趣的因变量和你感兴趣的自变量,你现在还有第三种类型的变量:你并不真正感兴趣的自变量,但是你期望对你感兴趣的变量产生影响。这就是我所说的协变量。将协变量纳入模型可以大大提高统计模型对我们感兴趣的变量的实际分析能力。换句话说,在最优情况下,协变量解释了数据中如此多的无法解释的噪声,因此所留下的可变性使我们能够得出关于其他变量之间的关系的结论,这是我们以前看不到的。因此,从上面的模型可以变成:
因此,问题是如何决定是否在您的模型/分析中包含这样的协变量。在这个领域中非常重要的一个分析是协方差分析。
我将在此停下来,以确保我正确理解这个问题,并很高兴听到这是否有助于到目前为止。
https://datascience.stackexchange.com/questions/82558
复制相似问题