我有特性数据X和(u_1, u_2, u_3, u_4) = f(X)与u_1, u_2, u_3, u_4 \in \mathbb{R^+}的四个预测。f是一个未知的函数(没有关于它的属性的假设),需要学习它来预测样本外的u。
我有训练数据,包括大约。X和f(X)的10k观测(行)。一个与数据相关的问题是,我知道在我的样本外数据中,我将观察到两个特性x_1和x_2的许多看不见的特征值,我知道它们对f(X)的值非常重要。
是否有一种模型非常适合学习函数f并进行多个实值预测( (u_1, u_2, u_3, u_4) ),理想情况下,f也可以很好地推广到未见数据?
发布于 2022-07-28 15:13:09
嗯,我在DS上也是很新的,但是我相信你需要尝试一些模型来确定每个模型更适合我们的数据。类似于:
模型的目的是概括现实世界,因此,您需要研究这个看不见的值是否与您所拥有的数据很远。这可能会导致您进入一个非现实主义的模型,您需要收集更多的数据。
https://datascience.stackexchange.com/questions/113047
复制相似问题