我正在尝试应用kfold方法,但我不知道如何访问生成的训练和测试集。在浏览了几个博客和scikitlearn用户指南之后,人们所做的唯一一件事就是打印训练和测试集。这对于较小的数据帧可能有效,但对于较大的数据帧则没有用处。有谁可以帮我? 我使用的数据:https://github.com/ageron/handson-ml/tree/master/datasets/housing 我现在所在的位置: X = housing[['total_rooms', 'total_bedrooms']]
y = housing['median_house_valu
我有一个包含95行9列的数据集,并希望进行5次交叉验证。在训练中,前8列(特征)用于预测第九列。我的测试集是正确的,但是我的x训练集的大小是(4, 19 ,9),而它应该只有8列,我的y训练集是(4,9),而它应该有19行。我对子数组的索引不正确吗?np.random.shuffle(kdata) # Shuffle all rows
folds = np.array_split(kdata, k) # each fold i