我将感谢您的投入,预测ML模型(S)可以最适合我们的数据集。
数据集的主要特征是x、y(连续的)和c(约为L=500无序级别的因子)。第二性特征(~20)既是连续的,又是因素的。我们知道,最低阶相关是x~y,我们还知道,对c中的每一层进行x~y建模,都大大提高了拟合效果。
当然,我们可以建立L独立的线性模型,但是我们想要探索一个单一的模型,在这个模型中,这些次线性关系是部分相关的。原因是某些水平的c具有相对较低的统计量,并将受益于全局x~y关系。此外,当扩展到次要特性时,我们希望使用单一的模型。
欢迎任何建议。(对于特定的库,首选是R。)
发布于 2018-05-04 12:18:22
广义线性模型(glm)的工作是合理的。
glm(y ~x* c,data=df)及其扩展
https://datascience.stackexchange.com/questions/31131
复制相似问题