文章/答案/技术大牛

发布

社区首页 >问答首页 >将数据集拆分为5~折以进行交叉验证

问将数据集拆分为5~折以进行交叉验证
EN

Stack Overflow用户

提问于 2021-11-01 21:25:58

回答 1查看 93关注 0票数 1

我有一个数据集，我希望将其拆分为5倍(distinct)，而不是传统的80-20拆分。

举个例子：

X = pd.DataFrame({'a': [1, 3, 5, 7, 4, 5, 6, 4, 7, 9],
                  'b': [3, 5, 6, 2, 4, 6, 7, 8, 7, 8],
                  'c': [2, 3, 4, 5, 6, 7, 8, 9, 2, 1]} )
y = [2, 3, 1, 1, 3, 2, 1, 3, 2, 2]

X

    a   b   c
0   1   3   2
1   3   5   3
2   5   6   4
3   7   2   5
4   4   4   6
5   5   6   7
6   6   7   8
7   4   8   9
8   7   7   2
9   9   8   1

这样我就有了具有相应y1,y2,..,y5的X1,X2,..,X5。

python

pandas

dataframe

cross-validation

k-fold

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-11-01 21:28:35

使用sklearn中的KFold

from sklearn.model_selection import KFold

print(list(kf.split(X, y)))

# Output:
[(array([2, 3, 4, 5, 6, 7, 8, 9]), array([0, 1])),
 (array([0, 1, 4, 5, 6, 7, 8, 9]), array([2, 3])),
 (array([0, 1, 2, 3, 6, 7, 8, 9]), array([4, 5])),
 (array([0, 1, 2, 3, 4, 5, 8, 9]), array([6, 7])),
 (array([0, 1, 2, 3, 4, 5, 6, 7]), array([8, 9]))]

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69802954

复制

相似问题

问将数据集拆分为5~折以进行交叉验证
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将数据集拆分为5~折以进行交叉验证EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将数据集拆分为5~折以进行交叉验证
EN