我有一个问题,需要对二进制目标y进行预测,因为X提供了一组特性,X自然是以重复测量的形式嵌套的。数据是用来描述游戏中人的行为的,在这个游戏中,每一行数据X_t都有时间戳,并表示时间t的行为。我的数据的一个玩具示例可以如下所示:
ID session X1 X2 y
1 1 0.5 a 0
1 2 0.12 b 0
1 3 1.1 d 1
2 1 5.2 c 1
2 2 4.1 a 0我把这看作是一个典型的分类问题,每个样本X_t都是一个iid,XGBoost分类器得到了足够好的结果。然而,许多在线文章指出,这种形式的面板数据(在这里,我们发现每个主题重复测量)更好地处理与混合效应模型。这优秀的博客文章通过混合效应随机森林(MERFs)来解决回归问题,但是说分类模型还没有实现(在2017中就是这样)。
到目前为止,我还不知道MERF对于分类问题的实现。所以我的问题是,是否有人完成了类似的分类任务,并使用混合效应模型来解决它?如果是,是否存在这样一个模型的代码实现?(最好是python,但我也可以使用R来测试它)。
发布于 2023-01-11 12:43:26
我实际上是在寻找类似的东西,然而,在我的例子中,我正在寻找处理多类标记数据的东西。
在我的搜索中,我偶然发现了GPBoost,它可能正好满足您的需求。
https://github.com/fabsig/GPBoost
GPBoost和R都应该是可用的,如果我是对的,还包括二进制分类。
https://datascience.stackexchange.com/questions/116423
复制相似问题