想象一下,我们有一些随时间变化的特性列表。列表的每一行对应于一个示例(空间上的更改)。我想知道机器学习是否能够确定每个样本对另一个样本的影响。例如,样本"S“的目标值取决于样本的特征"S-4”、“AC.26-3”、“For 2”、“回-1”、"S+1“、"S+2”、"S+3“。我已经看到了一些像积极学习和因果推理这样的东西,但仍然不确定它们对我的目标是否有用。为了更详细地说明,想象一下我们下面的情况:

红线是一年的结果,蓝色的是明年。我们有一个适当的数量的这些结果,因此,以这种方式,我们没有问题。对于红色圆圈和其他样本所显示的目标,我们有不同的特征。但是我正在寻找一种算法来告诉我第一组是在红圈点还是在第二组影响我的目标。要达到这个目的,使用Causal inference或Active Learning是好的吗?
发布于 2020-12-01 16:27:09
这是如何将问题表述为因果推理问题的方式:
第1组为对照组,2组为治疗组。根据"S-4“、"S-3”、“16-2”、“双-1”、"S+1“、"S+2”、“S+3”等观测结果,建立了适合于观测的模型。有多少模型取决于学习类型,S,T还是X学习者.
基本上,这些学习者所做的,是将特征分别与目标(S)相匹配,有条件地取决于来自控制或治疗的特征。
一旦你适应了学习者,一个治疗效果是估计的。您可以将治疗效果看作是对任何一组的预测之间的差异,考虑到仅限于另一组的知识。
下面是来自优步的因果关系的的示例代码
from causalml.inference.meta import XGBTRegressor
y, X, treatment = load_data()
xg = XGBTRegressor(random_state=42)
te, lb, ub = xg.estimate_ate(X, treatment, y)
print('Average Treatment Effect (XGBoost): {:.2f} ({:.2f}, {:.2f})'.format(te[0], lb[0], ub[0]))https://datascience.stackexchange.com/questions/86143
复制相似问题